您好,登錄后才能下訂單哦!
本篇文章為大家展示了methylKit是進(jìn)行差異甲基化分析,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。
methylKit 是一個(gè)用于分析甲基化測(cè)序數(shù)據(jù)的R包,不僅支持WGBS
,RRBS
和目的區(qū)域甲基化測(cè)序,還支持oxBS-sq
, TAB-seq
等分析5hmc
的數(shù)據(jù)。 其核心功能是差異甲基化分析和差異甲基化位點(diǎn)和區(qū)域的注釋。
安裝過程如下:
source(“http://bioconductor.org/biocLite.R“)
biocLite(“methylKit”)
推薦使用最新版本的R進(jìn)行安裝,這樣可以使用最新版本的methylKist
。
利用methylKit
做差異分析包括3步
每個(gè)樣本一個(gè)原始數(shù)據(jù),methylKit
支持兩種格式的methylation calling
文件
純文本格式
內(nèi)容如下
每一行是一個(gè)甲基化位點(diǎn),coverage
代表覆蓋這個(gè)位點(diǎn)的reads數(shù),freqC
代表甲基化C的比例,freqT
代表非甲基化C的比例。這種純文本格式內(nèi)容非常直觀,文件大小相比bam 文件小很多,讀取的速度更快。
純文本格式的讀取過程如下
treatment
參數(shù)指定樣本的分組,0代表control
組,1代表treatment
組
bam文件
直接讀取Bismark
軟件比對(duì)產(chǎn)生的bam文件,通過processBismarkAln
實(shí)現(xiàn)
用法如下:
將所有樣本的甲基化情況合并,得到所有樣本的甲基化表達(dá)譜,用法如下
meth=unite(myobj, destrand=FALSE)
meth
中的內(nèi)容如下,其實(shí)就是之前的methylation calling
文件的合并
在合并的過程中,默認(rèn)情況下,只有所有的樣本都包含該位點(diǎn)時(shí),才會(huì)保留,本質(zhì)就是取的所有樣本的交集,如果你想要取并集,可以修改min.per.group
參數(shù)的值,該參數(shù)的值代表每組中至少有多少個(gè)樣本覆蓋該位點(diǎn)時(shí)才保留,如果設(shè)置為1,就是取并集。
meth.min=unite(myobj,min.per.group=1L)
通過calculateDiffMeth
函數(shù)來執(zhí)行差異甲基化分析,用法如下
myDiff=calculateDiffMeth(meth)
根據(jù)甲基化C是變多了還是變少了,可以將差異甲基化的結(jié)果分為兩大類:
hypermethylated
hypomethylated
hypermethylated
表示相比control
組,treatment
組中的甲基化C更多;hypomethylated
則相反,表示treatment
組中的甲基化C比control
組中少。
采用getMethylDiff
函數(shù)提取差異分析的結(jié)果,用法如下
difference
函數(shù)表明差異的閾值,只有差異大于該閾值時(shí),才會(huì)保留,起始就是meth.diff
的值,注意是絕對(duì)值大于difference
的值。
除了difference
閾值之外,還有qvalue
閾值,小于該閾值的結(jié)果保留。在methylKit
中,校正p值采用的是SILM
算法,和我們常規(guī)的BH
算法不同。type
參數(shù)定義差異的類型,如果你只關(guān)注hypermethylated
或者hypomethylated
,可以設(shè)置type 參數(shù)的值,單獨(dú)篩選。
在methylKit
中,它的差異分析總是針對(duì)合并后的甲基化表達(dá)譜,如果你的甲基化表達(dá)譜每一行是一個(gè)甲基化位點(diǎn),那么差異分析的結(jié)果就是差異甲基化位點(diǎn);如果你的表達(dá)譜每一行是一個(gè)甲基化區(qū)域,那么差異分析的結(jié)果就是差異甲基化區(qū)域。上面的例子都是針對(duì)差異甲基化位點(diǎn)的,下面看下差異甲基化區(qū)域的分析。
首先遇到的問題就是甲基化區(qū)域如何界定,在methylKit
中,按照滑動(dòng)窗口的方式定義甲基化區(qū)域,默認(rèn)窗口大小為10000
bp ,步長(zhǎng)為10000bp,通過tileMethylCounts
函數(shù)實(shí)現(xiàn)。
完整的差異甲基化區(qū)域分析的代碼如下:
上述內(nèi)容就是methylKit是進(jìn)行差異甲基化分析,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。