您好,登錄后才能下訂單哦!
本篇文章為大家展示了WGCNA如何從module中挖掘關(guān)鍵基因,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。
識(shí)別到與表型數(shù)據(jù)相關(guān)的modules之后,還可以在該modules中進(jìn)一步篩選基因,為了方便篩選,對(duì)于每個(gè)基因定義了以下三個(gè)統(tǒng)計(jì)量
連接度,在之前的文章中,簡(jiǎn)單提過(guò)這個(gè)概念,類似于網(wǎng)絡(luò)中節(jié)點(diǎn)的degree
的概念,只不過(guò)在加權(quán)共表達(dá)網(wǎng)絡(luò)中,由于每條邊代表兩個(gè)基因間的相關(guān)性的大小,對(duì)應(yīng)一個(gè)數(shù)值,所以一個(gè)基因在共表達(dá)網(wǎng)絡(luò)中的連接度定義為與該基因相連的所有邊的數(shù)值之和。
另外,根據(jù)相連的基因是否和該基因位于同一個(gè)module, 又可以將邊分為兩類,和該基因位于同一個(gè)module內(nèi),定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過(guò)intramodularConnectivity
函數(shù)計(jì)算連接度,用法如下
# 計(jì)算基因間的鄰接值 ADJ1=abs(cor(datExpr,use="p"))^6 #計(jì)算連接度 Alldegrees1=intramodularConnectivity(ADJ1, colorh2)
計(jì)算的結(jié)果如下
> head(Alldegrees1) kTotal kWithin kOut kDiff Gene1 31.80186 28.37595 3.425906 24.95005 Gene2 28.88249 26.47896 2.403522 24.07544 Gene3 25.38600 23.11852 2.267486 20.85103
KTotal
代表該基因的所有邊的連接度,KWithin
代表和該基因位于同一個(gè)module下的邊的連接度,KOut
代表和該基因位于不同module下的邊的連接度,所以KTotal
是KWithin
和KOut
之和,KDiff
代表KWithin
和KOut
的差值。
在module中,會(huì)存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時(shí)只考慮位于該module下的邊,就是上文的KWithin
。
簡(jiǎn)稱MM, 將該基因的表達(dá)量與module的第一主成分,即module eigengene進(jìn)行相關(guān)性分析就可以得到MM值,所以MM值本質(zhì)上是一個(gè)相關(guān)系數(shù),如果基因和某個(gè)module的MM值為0,說(shuō)明二者根本不相關(guān),該基因不屬于這個(gè)module; 如果MM的絕對(duì)值接近1,說(shuō)明基因與該module相關(guān)性很高。
在WGCNA中,計(jì)算基因與module之間的MM值的代碼如下
datKME = signedKME( datExpr, datME, outputColumnName="MM.")
第一個(gè)參數(shù)為基因表達(dá)量,第二個(gè)參數(shù)為Module Eigengene值,結(jié)果如下
> head(datKME) MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170 Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483 Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211 Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603 Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067 Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
簡(jiǎn)稱GS, 將該基因的表達(dá)量與對(duì)應(yīng)的表型數(shù)值進(jìn)行相關(guān)性分析,最終的相關(guān)系數(shù)的值就是GS, GS反映出基因表達(dá)量與表型數(shù)據(jù)的相關(guān)性,計(jì)算GS的代碼如下
GS1=as.numeric(cor(y,datExpr, use="p"))
通過(guò)以上三個(gè)量化指標(biāo),可以方便對(duì)module下的基因進(jìn)行篩選。通常情況下,通過(guò)module和表型數(shù)據(jù)的相關(guān)性分析,我們可以篩選得到和感興趣的某一表型相關(guān)的具體的modules,在該module下面深入挖掘基因時(shí),可以通過(guò)MM
和GS
兩個(gè)指標(biāo)作為過(guò)濾手段,示例如下
FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8
假設(shè)brown是我們找到的和表型高度相關(guān)的module, 其中的關(guān)鍵基因可以定義為和brown
這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關(guān)鍵基因后,可以通過(guò)功能富集分析進(jìn)一步挖掘其功能。
上述內(nèi)容就是WGCNA如何從module中挖掘關(guān)鍵基因,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。