溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

methylKit是進(jìn)行差異甲基化分析

發(fā)布時(shí)間:2021-12-28 16:26:50 來源:億速云 閱讀:223 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了methylKit是進(jìn)行差異甲基化分析,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。

methylKit 是一個(gè)用于分析甲基化測(cè)序數(shù)據(jù)的R包,不僅支持WGBSRRBS和目的區(qū)域甲基化測(cè)序,還支持oxBS-sq, TAB-seq等分析5hmc的數(shù)據(jù)。 其核心功能是差異甲基化分析和差異甲基化位點(diǎn)和區(qū)域的注釋。

安裝過程如下:

source(“http://bioconductor.org/biocLite.R“)
biocLite(“methylKit”)

推薦使用最新版本的R進(jìn)行安裝,這樣可以使用最新版本的methylKist。
利用methylKit 做差異分析包括3步

1. 讀取原始數(shù)據(jù)

每個(gè)樣本一個(gè)原始數(shù)據(jù),methylKit支持兩種格式的methylation calling文件

  • 純文本格式


    內(nèi)容如下


methylKit是進(jìn)行差異甲基化分析

每一行是一個(gè)甲基化位點(diǎn),coverage 代表覆蓋這個(gè)位點(diǎn)的reads數(shù),freqC 代表甲基化C的比例,freqT 代表非甲基化C的比例。這種純文本格式內(nèi)容非常直觀,文件大小相比bam 文件小很多,讀取的速度更快。
純文本格式的讀取過程如下

methylKit是進(jìn)行差異甲基化分析
treatment參數(shù)指定樣本的分組,0代表control組,1代表treatment

  • bam文件

直接讀取Bismark軟件比對(duì)產(chǎn)生的bam文件,通過processBismarkAln實(shí)現(xiàn)
用法如下:

methylKit是進(jìn)行差異甲基化分析

2. 合并所有樣本的數(shù)據(jù)

將所有樣本的甲基化情況合并,得到所有樣本的甲基化表達(dá)譜,用法如下

meth=unite(myobj, destrand=FALSE)

meth 中的內(nèi)容如下,其實(shí)就是之前的methylation calling文件的合并

methylKit是進(jìn)行差異甲基化分析

在合并的過程中,默認(rèn)情況下,只有所有的樣本都包含該位點(diǎn)時(shí),才會(huì)保留,本質(zhì)就是取的所有樣本的交集,如果你想要取并集,可以修改min.per.group參數(shù)的值,該參數(shù)的值代表每組中至少有多少個(gè)樣本覆蓋該位點(diǎn)時(shí)才保留,如果設(shè)置為1,就是取并集。

meth.min=unite(myobj,min.per.group=1L)

3. 執(zhí)行差異分析

通過calculateDiffMeth函數(shù)來執(zhí)行差異甲基化分析,用法如下

myDiff=calculateDiffMeth(meth)

根據(jù)甲基化C是變多了還是變少了,可以將差異甲基化的結(jié)果分為兩大類:

  1. hypermethylated

  2. hypomethylated

hypermethylated表示相比control組,treatment組中的甲基化C更多;hypomethylated則相反,表示treatment組中的甲基化C比control組中少。
采用getMethylDiff函數(shù)提取差異分析的結(jié)果,用法如下

methylKit是進(jìn)行差異甲基化分析

difference函數(shù)表明差異的閾值,只有差異大于該閾值時(shí),才會(huì)保留,起始就是meth.diff的值,注意是絕對(duì)值大于difference的值。

除了difference閾值之外,還有qvalue閾值,小于該閾值的結(jié)果保留。在methylKit中,校正p值采用的是SILM算法,和我們常規(guī)的BH算法不同。
type參數(shù)定義差異的類型,如果你只關(guān)注hypermethylated或者hypomethylated,可以設(shè)置type 參數(shù)的值,單獨(dú)篩選。

methylKit中,它的差異分析總是針對(duì)合并后的甲基化表達(dá)譜,如果你的甲基化表達(dá)譜每一行是一個(gè)甲基化位點(diǎn),那么差異分析的結(jié)果就是差異甲基化位點(diǎn);如果你的表達(dá)譜每一行是一個(gè)甲基化區(qū)域,那么差異分析的結(jié)果就是差異甲基化區(qū)域。上面的例子都是針對(duì)差異甲基化位點(diǎn)的,下面看下差異甲基化區(qū)域的分析。

首先遇到的問題就是甲基化區(qū)域如何界定,在methylKit中,按照滑動(dòng)窗口的方式定義甲基化區(qū)域,默認(rèn)窗口大小為10000 bp ,步長(zhǎng)為10000bp,通過tileMethylCounts函數(shù)實(shí)現(xiàn)。

完整的差異甲基化區(qū)域分析的代碼如下:

methylKit是進(jìn)行差異甲基化分析

上述內(nèi)容就是methylKit是進(jìn)行差異甲基化分析,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI