您好,登錄后才能下訂單哦!
這期內(nèi)容當中小編將會給大家?guī)碛嘘P(guān)illumina的DNA甲基化芯片探針的P值該如何計算,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
illumina 的DNA甲基化芯片,內(nèi)置了control 探針,用于檢測降噪,歸一化等各種用途。
以450K 為例, control 探針共有以下15種類型,每種類型的探針都有不同的用途
> unique(IlluminaHumanMethylation450kmanifest@data$TypeControl[[2]]) [1] "STAINING" "EXTENSION" [3] "HYBRIDIZATION" "TARGET REMOVAL" [5] "BISULFITE CONVERSION I" "BISULFITE CONVERSION II"[7] "SPECIFICITY I" "SPECIFICITY II" [9] "NON-POLYMORPHIC" "NEGATIVE" [11] "RESTORATION" "NORM_A" [13] "NORM_G" "NORM_C" [15] "NORM_T"
在這些control探針中, NEGATIVE
探針用于計算探針的P值。
minfi
中計算探針P值的過程如下:
探針的P值 = 1 - P(intensity)
假設(shè)探針的信號強度服從正態(tài)分布,首先要計算出該正態(tài)分布的期望和方差。
由于I 型探針和II 型探針的技術(shù)原理不同,所以兩種探針是分開計算的。
首先根據(jù)negative 探針的信號強度,分別計算紅綠兩種通道的均值和方差
# 獲取negative 探針的IDcontrolIdx <- getControlAddress(rgSet, controlType = "NEGATIVE") # 計算紅色熒光通道的均值和標準差r <- getRed(rgSet) rBg <- r[controlIdx,,drop=FALSE] rMu <- matrixStats::colMedians(rBg) rSd <- matrixStats::colMads(rBg)# 計算綠色熒光通道的均值和標準差g <- getGreen(rgSet) gBg <- g[controlIdx,,drop=FALSE] gMu <- matrixStats::colMedians(gBg) gSd <- matrixStats::colMads(gBg)# 這里用了中位數(shù)代替了算數(shù)平均值
I 型探針發(fā)出的是單色熒光,可能是紅色也可能是綠色,所以紅色和綠色也是單獨計算的。
對于紅色熒光的I 型探針而言,其正態(tài)分布的均值等于negative 探針紅色熒光通道的均值,標準差對應(yīng)negative 紅色熒光通道的方差
TypeI.Red <- getProbeInfo(rgSet, type = "I-Red") intensity <- r[TypeI.Red$AddressA, i] + r[TypeI.Red$AddressB, i] detP[TypeI.Red$Name, i] <- 1-pnorm(intensity, mean=rMu[i]*2, sd=rSd[i]*2)
對于綠色熒光的I 型探針而言,其正態(tài)分布的均值對應(yīng)negative 綠熒光通道的均值,標準差對應(yīng)negative 綠色熒光通道的方差
TypeI.Green <- getProbeInfo(rgSet, type = "I-Green") intensity <- g[TypeI.Green$AddressA, i] + g[TypeI.Green$AddressB, i] detP[TypeI.Green$Name, i] <- 1-pnorm(intensity, mean=gMu[i]*2, sd=gSd[i]*2)
II 型探針是雙色熒光,其正態(tài)分布的均值對應(yīng)negative探針紅色熒光和綠色熒光的中位數(shù)之和,標準差對應(yīng)紅色熒光和綠色熒光的標準差之和
TypeII <- getProbeInfo(rgSet, type = "II") intensity <- r[TypeII$AddressA, i] + g[TypeII$AddressA, i] detP[TypeII$Name, i] <- 1-pnorm(intensity, mean=rMu[i]+gMu[i], sd=rSd[i]+gSd[i])
NEGATIVE
探針是一系列質(zhì)量差的探針信號,假設(shè)其分布是一個正態(tài)分布。
在某個樣本中,某個探針檢測到的信號強度為 intensity,這個intensity 可能是一個質(zhì)量差的信號,也可能是一個質(zhì)量高的信號。
該探針檢測到的信號質(zhì)量可靠記為事件A, 質(zhì)量不可靠記為事件B, 很顯然 P(A)+ P(B) = 1。
探針的P值代表這個探針的信號質(zhì)量可靠的概率,所以在計算時,只需要用1減去不可靠的概率就行了。
在計算不可靠的概率時,由于I型探針和II 型探針的技術(shù)原理,共分成3個正態(tài)分布來計算概率。以上就是minfi
計算探針P值的詳細過程。
計算出探針的P值之后,就可以根據(jù)p值進行過濾了。從計算過程也可以看出,P值越小,探針質(zhì)量越高。
上述就是小編為大家分享的illumina的DNA甲基化芯片探針的P值該如何計算了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。