溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

DESeq2有什么用

發(fā)布時間:2021-12-18 14:56:22 來源:億速云 閱讀:222 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要講解了“DESeq2有什么用”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“DESeq2有什么用”吧!

對于RNA_Seq而言,得到基因/轉(zhuǎn)錄本的定量結(jié)果僅僅是第一步, 只是對測序數(shù)據(jù)的匯總, 相同的工作也可以通過芯片直接得到。

無論是芯片也好,測序也罷,定量只不過是量化生物體內(nèi)轉(zhuǎn)錄本的表達豐度,僅僅一個定量的結(jié)果并不能得到有效的生物學(xué)結(jié)論。為了回答生物學(xué)問題,還需要進行后續(xù)的差異分析。

由于定量的方式有很多種,比如raw  count, TPM, RPKM/FPKM 等,不同的定量方式其表達量的分布是不同的,所以差異分析時采用的軟件與算法也會不同。本文介紹DESeq2這個R包,主要是針對raw count的定量結(jié)果,進行差異分析。

DESeq2要求輸入的定量結(jié)果為raw count形式,raw  count其實是根據(jù)reads數(shù)計算得到,所以要求必須全部是整數(shù)。

由于不同樣本的測序量不完全相同,所以raw count無法在樣本間直接比較,就是說同一個基因在樣本A中的raw count大于樣本B中的raw count , 并不意味這在A中的表達量就高,數(shù)值大可能是由于樣本A測序的reads 總數(shù)大造成的。

為了在樣本間進行差異分析,首先就需要對原始的raw count 表達量數(shù)據(jù)進行歸一化。在DESeq2中,通過estimateSizeFactors函數(shù)為每個樣本計算一個系數(shù),稱之為sizefactor, 示意如下

> dds <- makeExampleDESeqDataSet(n=1000, m=4)
> dds <- estimateSizeFactors(dds)
> sizeFactors(dds)
sample1  sample2  sample3  sample4
1.010543 1.033960 1.023026 1.001038

具體的計算過程如下:

原始的表達量矩陣每一行代表一個基因,每一列代表一個樣本,用counts表示,先進行l(wèi)og轉(zhuǎn)換,轉(zhuǎn)換之后,計算每個基因在所有樣本中的均值,代碼如下

loggeomeans <- rowMeans(log(counts))

計算單個樣本的sizafactor時,將該樣本中每個基因的表達量減去對應(yīng)的所有樣本中的均值,然后取中位數(shù)。由于開始進行了log轉(zhuǎn)換,最后在轉(zhuǎn)換回來。 假定一個樣本中所有基因的表達量為cnts, 代碼如下

exp(median((log(cnts) - loggeomeans)[is.finite(loggeomeans) & cnts > 0]))

需要注意的時,在計算中位數(shù)時,對基因進行了過濾,需要滿足以下兩個條件
1.在該樣本中該基因的表達量大于0
2.在所有樣本中該基因的表達量都大于0,而且取log之后的和不為0

實際上第二個條件已經(jīng)包含第一個條件了,在原始的表達量矩陣中,肯定會有基因在部分樣本表達量為0的情況,所以最終計算中位數(shù)時,只會用到部分基因。

計算出每個樣本的sizefactor之后,將該樣本原始的表達量除以該樣本的sizefactor, 就得到了歸一化之后的表達量。

對于raw count 的歸一化,本質(zhì)是消除不同樣本測序總量不同的影響,反應(yīng)到表達量矩陣上,就是每列的總和不同。DESeq2計算得到的sizefactor和每列的總和之間是一個線性關(guān)系,示意如下

所以sizefactors 能夠用來進行歸一化。

感謝各位的閱讀,以上就是“DESeq2有什么用”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對DESeq2有什么用這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI