illumina的DNA甲基化芯片探針的P值該如何計算

發(fā)布時間：2021-12-21 16:58:06 來源：億速云閱讀：231 作者：柒染欄目：大數(shù)據(jù)

這期內(nèi)容當中小編將會給大家?guī)碛嘘P(guān)illumina的DNA甲基化芯片探針的P值該如何計算，文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

illumina 的DNA甲基化芯片，內(nèi)置了control 探針，用于檢測降噪，歸一化等各種用途。

以450K 為例, control 探針共有以下15種類型，每種類型的探針都有不同的用途

> unique(IlluminaHumanMethylation450kmanifest@data$TypeControl[[2]])
[1] "STAINING"                "EXTENSION"              [3] "HYBRIDIZATION"           "TARGET REMOVAL"         [5] "BISULFITE CONVERSION I"  "BISULFITE CONVERSION II"[7] "SPECIFICITY I"           "SPECIFICITY II"         [9] "NON-POLYMORPHIC"         "NEGATIVE"               [11] "RESTORATION"             "NORM_A"                 [13] "NORM_G"                  "NORM_C"                 [15] "NORM_T"

在這些control探針中， NEGATIVE探針用于計算探針的P值。

minfi 中計算探針P值的過程如下：

探針的P值 = 1 - P(intensity)

假設(shè)探針的信號強度服從正態(tài)分布，首先要計算出該正態(tài)分布的期望和方差。
由于I 型探針和II 型探針的技術(shù)原理不同，所以兩種探針是分開計算的。

首先根據(jù)negative 探針的信號強度，分別計算紅綠兩種通道的均值和方差

# 獲取negative 探針的IDcontrolIdx <- getControlAddress(rgSet, controlType = "NEGATIVE")   

# 計算紅色熒光通道的均值和標準差r <- getRed(rgSet)
rBg <- r[controlIdx,,drop=FALSE]
rMu <- matrixStats::colMedians(rBg)
rSd <- matrixStats::colMads(rBg)# 計算綠色熒光通道的均值和標準差g <- getGreen(rgSet)
gBg <- g[controlIdx,,drop=FALSE]
gMu <- matrixStats::colMedians(gBg)
gSd <- matrixStats::colMads(gBg)# 這里用了中位數(shù)代替了算數(shù)平均值

I 型探針

I 型探針發(fā)出的是單色熒光，可能是紅色也可能是綠色，所以紅色和綠色也是單獨計算的。

對于紅色熒光的I 型探針而言，其正態(tài)分布的均值等于negative 探針紅色熒光通道的均值，標準差對應(yīng)negative 紅色熒光通道的方差

TypeI.Red <- getProbeInfo(rgSet, type = "I-Red")
intensity <- r[TypeI.Red$AddressA, i] + r[TypeI.Red$AddressB, i]
detP[TypeI.Red$Name, i] <- 1-pnorm(intensity, mean=rMu[i]*2, sd=rSd[i]*2)

對于綠色熒光的I 型探針而言，其正態(tài)分布的均值對應(yīng)negative 綠熒光通道的均值，標準差對應(yīng)negative 綠色熒光通道的方差

TypeI.Green <- getProbeInfo(rgSet, type = "I-Green")
intensity <- g[TypeI.Green$AddressA, i] + g[TypeI.Green$AddressB, i]
detP[TypeI.Green$Name, i] <- 1-pnorm(intensity, mean=gMu[i]*2, sd=gSd[i]*2)

I 型探針

II 型探針是雙色熒光，其正態(tài)分布的均值對應(yīng)negative探針紅色熒光和綠色熒光的中位數(shù)之和，標準差對應(yīng)紅色熒光和綠色熒光的標準差之和

TypeII <- getProbeInfo(rgSet, type = "II")
intensity <- r[TypeII$AddressA, i] + g[TypeII$AddressA, i]
detP[TypeII$Name, i] <- 1-pnorm(intensity, mean=rMu[i]+gMu[i], sd=rSd[i]+gSd[i])

NEGATIVE探針是一系列質(zhì)量差的探針信號，假設(shè)其分布是一個正態(tài)分布。
在某個樣本中，某個探針檢測到的信號強度為 intensity，這個intensity 可能是一個質(zhì)量差的信號，也可能是一個質(zhì)量高的信號。

該探針檢測到的信號質(zhì)量可靠記為事件A, 質(zhì)量不可靠記為事件B, 很顯然 P(A）+ P(B) = 1。

探針的P值代表這個探針的信號質(zhì)量可靠的概率，所以在計算時，只需要用1減去不可靠的概率就行了。

在計算不可靠的概率時，由于I型探針和II 型探針的技術(shù)原理，共分成3個正態(tài)分布來計算概率。以上就是minfi計算探針P值的詳細過程。

計算出探針的P值之后，就可以根據(jù)p值進行過濾了。從計算過程也可以看出，P值越小，探針質(zhì)量越高。

上述就是小編為大家分享的illumina的DNA甲基化芯片探針的P值該如何計算了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

illumina的DNA甲基化芯片探針的P值該如何計算

I 型探針

I 型探針

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽