溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

WGCNA如何從module中挖掘關(guān)鍵基因

發(fā)布時(shí)間:2021-12-21 15:27:02 來(lái)源:億速云 閱讀:257 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了WGCNA如何從module中挖掘關(guān)鍵基因,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

識(shí)別到與表型數(shù)據(jù)相關(guān)的modules之后,還可以在該modules中進(jìn)一步篩選基因,為了方便篩選,對(duì)于每個(gè)基因定義了以下三個(gè)統(tǒng)計(jì)量

1.  connectivity

連接度,在之前的文章中,簡(jiǎn)單提過(guò)這個(gè)概念,類似于網(wǎng)絡(luò)中節(jié)點(diǎn)的degree的概念,只不過(guò)在加權(quán)共表達(dá)網(wǎng)絡(luò)中,由于每條邊代表兩個(gè)基因間的相關(guān)性的大小,對(duì)應(yīng)一個(gè)數(shù)值,所以一個(gè)基因在共表達(dá)網(wǎng)絡(luò)中的連接度定義為與該基因相連的所有邊的數(shù)值之和。

另外,根據(jù)相連的基因是否和該基因位于同一個(gè)module, 又可以將邊分為兩類,和該基因位于同一個(gè)module內(nèi),定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過(guò)intramodularConnectivity函數(shù)計(jì)算連接度,用法如下

# 計(jì)算基因間的鄰接值
ADJ1=abs(cor(datExpr,use="p"))^6

#計(jì)算連接度
Alldegrees1=intramodularConnectivity(ADJ1, colorh2)

計(jì)算的結(jié)果如下

> head(Alldegrees1)
kTotal kWithin kOut kDiff
Gene1 31.80186 28.37595 3.425906 24.95005
Gene2 28.88249 26.47896 2.403522 24.07544
Gene3 25.38600 23.11852 2.267486 20.85103

KTotal代表該基因的所有邊的連接度,KWithin代表和該基因位于同一個(gè)module下的邊的連接度,KOut代表和該基因位于不同module下的邊的連接度,所以KTotalKWithinKOut之和,KDiff代表KWithinKOut的差值。

在module中,會(huì)存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時(shí)只考慮位于該module下的邊,就是上文的KWithin。

2. module member-ship

簡(jiǎn)稱MM, 將該基因的表達(dá)量與module的第一主成分,即module eigengene進(jìn)行相關(guān)性分析就可以得到MM值,所以MM值本質(zhì)上是一個(gè)相關(guān)系數(shù),如果基因和某個(gè)module的MM值為0,說(shuō)明二者根本不相關(guān),該基因不屬于這個(gè)module; 如果MM的絕對(duì)值接近1,說(shuō)明基因與該module相關(guān)性很高。

在WGCNA中,計(jì)算基因與module之間的MM值的代碼如下

datKME = signedKME(
datExpr,
datME,
outputColumnName="MM.")

第一個(gè)參數(shù)為基因表達(dá)量,第二個(gè)參數(shù)為Module Eigengene值,結(jié)果如下

> head(datKME)
MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow
Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170
Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483
Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211
Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603
Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067
Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
3. gene signigicancer

簡(jiǎn)稱GS, 將該基因的表達(dá)量與對(duì)應(yīng)的表型數(shù)值進(jìn)行相關(guān)性分析,最終的相關(guān)系數(shù)的值就是GS, GS反映出基因表達(dá)量與表型數(shù)據(jù)的相關(guān)性,計(jì)算GS的代碼如下

GS1=as.numeric(cor(y,datExpr, use="p"))

通過(guò)以上三個(gè)量化指標(biāo),可以方便對(duì)module下的基因進(jìn)行篩選。通常情況下,通過(guò)module和表型數(shù)據(jù)的相關(guān)性分析,我們可以篩選得到和感興趣的某一表型相關(guān)的具體的modules,在該module下面深入挖掘基因時(shí),可以通過(guò)MMGS兩個(gè)指標(biāo)作為過(guò)濾手段,示例如下

FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8

假設(shè)brown是我們找到的和表型高度相關(guān)的module, 其中的關(guān)鍵基因可以定義為和brown這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關(guān)鍵基因后,可以通過(guò)功能富集分析進(jìn)一步挖掘其功能。

上述內(nèi)容就是WGCNA如何從module中挖掘關(guān)鍵基因,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI