溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

bsseq是如何進行差異甲基化分析

發(fā)布時間:2021-12-28 16:26:32 來源:億速云 閱讀:155 作者:柒染 欄目:大數(shù)據(jù)

bsseq是如何進行差異甲基化分析,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

bsseq 主要用來分析WGBS的數(shù)據(jù), 安裝過程如下

source(“http://bioconductor.org/biocLite.R“)
biocLite(“bsseq”)

bsseq的分析主要包括以下4步:

  1. 讀取原始數(shù)據(jù)

  2. BSmooth

  3. t-test檢驗

  4. DMR

1. 讀取原始數(shù)據(jù)

bsseq要求的原始數(shù)據(jù)格式如下:

bsseq是如何進行差異甲基化分析

共6列數(shù)據(jù),制表符分隔,每一行代表一個甲基化位點,前5列很好理解,描述甲基化位點的染色體位置和類別,默認情況下bbseq用于分析CpG類型的甲基化位點。當然其他類型的數(shù)據(jù),比如CHG, CHH也支持,但是需要調整參數(shù)。Cov代表覆蓋到這個位點的reads數(shù),M代表其中發(fā)生了甲基化的reads數(shù)目。

每個樣本一個這樣的原始數(shù)據(jù),用來表示該樣本methylation calling的結果,這樣的數(shù)據(jù)我們從bismark的結果中也可以得到。當原始數(shù)據(jù)準備好之后,首選需要讀取所有樣本的原始數(shù)據(jù),然后導入到R中,生成一個bbseq定義的對象。在bbseq安裝的路徑下,提供了一個名為get_BS.chr22.R的腳本,展示了如何從讀取所有樣本原始數(shù)據(jù)的過程。

代碼如下

bsseq是如何進行差異甲基化分析

這里以mc_imr90_r1_22mc_imr90_r2_22兩個樣本的原始數(shù)據(jù)為例,詳細展示了讀取過程。我們只需要根據(jù)自己的數(shù)據(jù),適當修改上述代碼就可以了。主要注意sampleNamespData數(shù)據(jù)就可以了。

2 Smooth

已測試數(shù)據(jù)BS.chr22為例,smooth的過程如下

bsseq是如何進行差異甲基化分析

在實際分析中,由于甲基化位點很多,所以這一步時間特別久,為了提高速度,可以添加mc.cores參數(shù),這個參數(shù)指定了CPU個數(shù),用于并行執(zhí)行。

BS.chr22.1 <- BSmooth(BS.chr22, mc.cores = 2, verbose = TRUE)

3. T-test

在分析之前,有必要過濾掉覆蓋度較低的甲基化位點。通常保留在所有樣本中覆蓋度大于2的甲基化位點,但是也可以修改這個條件。過濾之后,直接通過BSmooth.tstat進行分析

下面的代碼基于bsseqData包中的數(shù)據(jù),這個數(shù)據(jù)包含了6個樣本,分為normalcancer兩組

bsseq是如何進行差異甲基化分析

group1 指定屬于treatment組的樣本,group2指定屬于control組的樣本。

4. DMR

通過dmrFinder 函數(shù)進行差異甲基化分析, 代碼如下:

bsseq是如何進行差異甲基化分析

cutoff 指定DMR的閾值,這個閾值根據(jù)t-test的結果進行調整。subset對差異甲基化的結果進行篩選,篩選包含甲基化位點個數(shù)大于3而且meanDiff 大于0.1的甲基化區(qū)域。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業(yè)資訊頻道,感謝您對億速云的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI