溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何使用HOMER進(jìn)行peak calling

發(fā)布時(shí)間:2021-07-24 11:11:57 來(lái)源:億速云 閱讀:358 作者:chen 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“如何使用HOMER進(jìn)行peak calling”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“如何使用HOMER進(jìn)行peak calling”吧!

HOMER是一款進(jìn)行motif預(yù)測(cè)的軟件,除此之外,該軟件還集成了許多其他功能,可以識(shí)別用于分析chip_seq,RNA_seq,Hi-C等數(shù)據(jù)。本文主要介紹如何通過(guò)HOMER來(lái)進(jìn)行peak calling。

在HOMER中,通過(guò)findPeaks這個(gè)命令來(lái)進(jìn)行peak calling, 這個(gè)命令有以下多種模式,對(duì)應(yīng)不同類(lèi)型的peak的識(shí)別

  1. factor
    這種模式用于識(shí)DNA和蛋白質(zhì)結(jié)合位點(diǎn),主要用于識(shí)別轉(zhuǎn)錄因子的結(jié)合位點(diǎn),預(yù)測(cè)出來(lái)的peak的長(zhǎng)度是一個(gè)固定的數(shù)值。

  2. histone
    這種模式用于識(shí)別發(fā)生組蛋白修飾的區(qū)域,該模式識(shí)別到的peak長(zhǎng)度不完全相同,是變化的數(shù)值。

  3. super
    這種模式用于識(shí)別超級(jí)增強(qiáng)子。

  4. groseq
    這種模式用于分析鏈特異性的GRO_seq數(shù)據(jù)

  5. tss
    這種模式用于分析5’RNA_seq/CAGE/5’GRO_seq, 目的是識(shí)別promoter/TSS區(qū)域

  6. dnase
    這種模式用于分析DNase_seq數(shù)據(jù),目的是識(shí)別DNase酶超敏位點(diǎn)

  7. mC
    這種模式用于識(shí)別DNA甲基化區(qū)域


對(duì)于chip_seq的peak calling而言,常用的模式就是factor, histone和super這3種模式。具體用法如下,分為兩步

1. makeTagDirectory

比對(duì)基因組得到bam文件之后,首先用通過(guò)makeTagDirectory這個(gè)命令,生成一個(gè)文件夾,用法如下

makeTagDirectory out_dir align.bam

輸出目錄文件如下

├── chr1.tags.tsv
├── chr2.tags.tsv
├── chr3.tags.tsv
...
├── chrY.tags.tsv
├── tagAutocorrelation.txt
├── tagCountDistribution.txt
├── tagInfo.txt
└── tagLengthDistribution.txt

默認(rèn)將每條染色體的比對(duì)情況有一個(gè)tags.tsv文件來(lái)存儲(chǔ),除此之外,還有幾個(gè)以tag開(kāi)頭的文件,包含了一些簡(jiǎn)單的統(tǒng)計(jì)信息。

tagCountDistribution.txt包含了測(cè)序深度的分布信息,第一列為測(cè)序深度的值,第二列為對(duì)應(yīng)的reads的比例。根據(jù)這個(gè)文件的前10行,在R里面可視化如下

如何使用HOMER進(jìn)行peak calling

對(duì)于chip樣本而言,unique mapping reads的比例越高越好,所以可以看到測(cè)序深度為1的比例是最高的。

tagLengthDistribution.txt包含了reads的長(zhǎng)度分布信息,第一列為長(zhǎng)度,第二列為對(duì)應(yīng)reads的比例, 在R里面可視化如下

如何使用HOMER進(jìn)行peak calling

可以對(duì)插入片段的長(zhǎng)度分布有一個(gè)直觀的了解。

tagAutocorrelation.txt用于評(píng)估測(cè)序數(shù)據(jù)正負(fù)鏈上測(cè)序深度分布的相關(guān)性,在R里面可視化如下

如何使用HOMER進(jìn)行peak calling

正負(fù)連的峰值間距離為插入偏度的長(zhǎng)度。

2. findPeaks

分別對(duì)input和IP樣本建立好tagdirectory之后就可以peak calling, 用法如下

findPeaks ip_tagdir/ -i input_tagdir -style histone -o homer.peak.txt

輸出結(jié)果和macs2的類(lèi)似,分成了兩部分,文件頭尾以#開(kāi)頭的行為注釋行,部分信息如下

如何使用HOMER進(jìn)行peak calling

peak對(duì)應(yīng)的行示意如下

如何使用HOMER進(jìn)行peak calling到此,相信大家對(duì)“如何使用HOMER進(jìn)行peak calling”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI