溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

illumina的DNA甲基化芯片探針的P值該如何計算

發(fā)布時間:2021-12-21 16:58:06 來源:億速云 閱讀:231 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當中小編將會給大家?guī)碛嘘P(guān)illumina的DNA甲基化芯片探針的P值該如何計算,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

illumina 的DNA甲基化芯片,內(nèi)置了control 探針,用于檢測降噪,歸一化等各種用途。

以450K  為例, control 探針共有以下15種類型,每種類型的探針都有不同的用途

> unique(IlluminaHumanMethylation450kmanifest@data$TypeControl[[2]])
[1] "STAINING"                "EXTENSION"              [3] "HYBRIDIZATION"           "TARGET REMOVAL"         [5] "BISULFITE CONVERSION I"  "BISULFITE CONVERSION II"[7] "SPECIFICITY I"           "SPECIFICITY II"         [9] "NON-POLYMORPHIC"         "NEGATIVE"               [11] "RESTORATION"             "NORM_A"                 [13] "NORM_G"                  "NORM_C"                 [15] "NORM_T"

在這些control探針中, NEGATIVE探針用于計算探針的P值。

minfi 中計算探針P值的過程如下:

探針的P值  =  1 - P(intensity)

假設(shè)探針的信號強度服從正態(tài)分布,首先要計算出該正態(tài)分布的期望和方差。
由于I 型探針和II 型探針的技術(shù)原理不同,所以兩種探針是分開計算的。

首先根據(jù)negative 探針的信號強度,分別計算紅綠兩種通道的均值和方差

# 獲取negative 探針的IDcontrolIdx <- getControlAddress(rgSet, controlType = "NEGATIVE")   

# 計算紅色熒光通道的均值和標準差r <- getRed(rgSet)
rBg <- r[controlIdx,,drop=FALSE]
rMu <- matrixStats::colMedians(rBg)
rSd <- matrixStats::colMads(rBg)# 計算綠色熒光通道的均值和標準差g <- getGreen(rgSet)
gBg <- g[controlIdx,,drop=FALSE]
gMu <- matrixStats::colMedians(gBg)
gSd <- matrixStats::colMads(gBg)# 這里用了中位數(shù)代替了算數(shù)平均值

I 型探針

I 型探針發(fā)出的是單色熒光,可能是紅色也可能是綠色,所以紅色和綠色也是單獨計算的。

對于紅色熒光的I 型探針而言,其正態(tài)分布的均值等于negative 探針紅色熒光通道的均值,標準差對應(yīng)negative 紅色熒光通道的方差

TypeI.Red <- getProbeInfo(rgSet, type = "I-Red")
intensity <- r[TypeI.Red$AddressA, i] + r[TypeI.Red$AddressB, i]
detP[TypeI.Red$Name, i] <- 1-pnorm(intensity, mean=rMu[i]*2, sd=rSd[i]*2)

對于綠色熒光的I 型探針而言,其正態(tài)分布的均值對應(yīng)negative 綠熒光通道的均值,標準差對應(yīng)negative 綠色熒光通道的方差

TypeI.Green <- getProbeInfo(rgSet, type = "I-Green")
intensity <- g[TypeI.Green$AddressA, i] + g[TypeI.Green$AddressB, i]
detP[TypeI.Green$Name, i] <- 1-pnorm(intensity, mean=gMu[i]*2, sd=gSd[i]*2)

I 型探針

II 型探針是雙色熒光,其正態(tài)分布的均值對應(yīng)negative探針紅色熒光和綠色熒光的中位數(shù)之和,標準差對應(yīng)紅色熒光和綠色熒光的標準差之和

TypeII <- getProbeInfo(rgSet, type = "II")
intensity <- r[TypeII$AddressA, i] + g[TypeII$AddressA, i]
detP[TypeII$Name, i] <- 1-pnorm(intensity, mean=rMu[i]+gMu[i], sd=rSd[i]+gSd[i])

NEGATIVE探針是一系列質(zhì)量差的探針信號,假設(shè)其分布是一個正態(tài)分布。
在某個樣本中,某個探針檢測到的信號強度為 intensity,這個intensity 可能是一個質(zhì)量差的信號,也可能是一個質(zhì)量高的信號。

該探針檢測到的信號質(zhì)量可靠記為事件A, 質(zhì)量不可靠記為事件B, 很顯然 P(A)+ P(B) = 1。

探針的P值代表這個探針的信號質(zhì)量可靠的概率,所以在計算時,只需要用1減去不可靠的概率就行了。

在計算不可靠的概率時,由于I型探針和II 型探針的技術(shù)原理,共分成3個正態(tài)分布來計算概率。以上就是minfi計算探針P值的詳細過程。

計算出探針的P值之后,就可以根據(jù)p值進行過濾了。從計算過程也可以看出,P值越小,探針質(zhì)量越高。

上述就是小編為大家分享的illumina的DNA甲基化芯片探針的P值該如何計算了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI