溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

tagAlign格式怎么在MACS軟件中的運(yùn)用

發(fā)布時間:2021-12-31 11:35:50 來源:億速云 閱讀:133 作者:柒染 欄目:大數(shù)據(jù)

本篇文章給大家分享的是有關(guān)tagAlign格式怎么在MACS軟件中的運(yùn)用,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

在使用macs進(jìn)行peak calling時,除了輸入樣本對應(yīng)的BAM/SAM文件之外,還可以輸入BED文件。BAM文件我們都非常 熟悉,將序列比對到基因組之后就可以產(chǎn)生這樣的文件,各個比對軟件也支持輸出BAM/SAM格式。這種格式的文件記錄了序列的比對情況,根據(jù)這個文件可以計算出基因組上的測序深度分布,從而比較不同樣本的分布進(jìn)行peak calling, 那么BED文件又是怎么一回事呢?

在BAM文件中,最核心的信息是序列和基因組區(qū)域的對應(yīng)關(guān)系,即那些序列比對上了基因組上的哪些區(qū)域,這個信息通過BED格式也是可以來記錄的。在bedtools中也提供了bamtobed的功能,基本用法如下

bedtools  bamtobed -i input.bam > out.bed

輸出內(nèi)容示意如下

tagAlign格式怎么在MACS軟件中的運(yùn)用

前三列表示reads比對上的染色體位置,第四列為reads的名稱,第五列代表比對的質(zhì)量值MAPQ,第六列代表正負(fù)鏈信息。

這種6列的BED文件在ENCODE被命名為tagAlign格式,詳細(xì)解釋參見如下鏈接

https://genome.ucsc.edu/FAQ/FAQformat.html#format13

對于雙端測序的數(shù)據(jù),還有一個特殊的bed格式-bedpe, 用法如下

bedtools  bamtobed  -i input.bam  -bedpe > out.bed

內(nèi)容示意如下

tagAlign格式怎么在MACS軟件中的運(yùn)用

bedpe格式在一行中顯示了R1和R2兩個reads的比對情況,列數(shù)為10列。
對于單端序列。直接用bed格式就可以;對于雙端學(xué)歷,推薦用bedpe格式。這兩種格式都可以稱之為tagAlign,可以作為macs的輸入文件,用法如下

macs2 callpeak \
-t ip.bedpe \
-c input.bedpe \
--outdir out_dir \
-n chip \
-g hs

tagAligen格式相比bam,文件大小會小很多,更加方便文件的讀取。

以上就是tagAlign格式怎么在MACS軟件中的運(yùn)用,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI