溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用homer進行peak注釋

發(fā)布時間:2021-07-22 20:31:34 來源:億速云 閱讀:1416 作者:chen 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“如何使用homer進行peak注釋”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“如何使用homer進行peak注釋”吧!

homer軟件集成了許多的功能,包括peak calling, peak注釋,motif分析等等,通過這一個軟件,就可以完成chip_seq的絕大部分分析內(nèi)容,不可謂不強大。本文主要介紹這個軟件進行peak注釋的用法。

在homer中通過annotatePeaks.pl這個腳本進行peak的注釋,分為以下兩步

1. 準備參考基因組的注釋信息

homer內(nèi)置了許多物種的注釋信息供我們下載,通過以下命令可以查看所有內(nèi)置的物種

perl configureHomer.pl --list

其中GENOMES部分對應的就是內(nèi)置支持的物種,部分內(nèi)容展示如下

GENOMES
v5.10   hg19    v6.0    human genome and annotation for UCSC hg19
+       mm10    v6.0    mouse genome and annotation for UCSC mm10
-       sacCer3 v6.0    yeast genome and annotation for UCSC sacCer3
-       panTro5 v6.0    human genome and annotation for UCSC panTro5

hg19為例,下載方式如下

perl configureHomer.pl  -install hg19

下載的信息保存在homer安裝目錄的data目錄下,以hg19為例,在data/genome/hg19目錄下,文件列表如下

├── chr1.fa
├── chr2.fa
├── chr3.fa
├── ...fa
├── chrom.sizes
├── conservation
├── hg19.annotation
├── hg19.aug
├── hg19.basic.annotation
├── hg19.full.annotation
├── hg19.miRNA
├── hg19.repeats
├── hg19.rna
├── hg19.splice3p
├── hg19.splice5p
├── hg19.stop
├── hg19.tss
├── hg19.tts
└── preparsed

包含了參考基因組的fasta序列以及不同區(qū)域的區(qū)間文件。
hg19.basic.annotation內(nèi)容如下

Intergenic      chr1    1       10873   +       N       1900000000
promoter-TSS (NR_046018)        chr1    10874   11974   +       P       1
non-coding (NR_046018, exon 1 of 3)     chr1    11975   12227   +       pseudo  125025
intron (NR_046018, intron 1 of 2)       chr1    12228   12612   +       I       810684
non-coding (NR_046018, exon 2 of 3)     chr1    12613   12721   +       pseudo  125026
intron (NR_046018, intron 2 of 2)       chr1    12722   13220   +       I       810684
non-coding (NR_046018, exon 3 of 3)     chr1    13221   13361   +       pseudo  125027

同時在data/accession目錄下,還有參考基因組對應的基因注釋文件。
human2gene.tsv記錄了基因的ubigene id, gene symbol等信息,內(nèi)容如下所示

ADE73044        3107    Hs.656020       NM_002117       ENSG00000204525         HLA-C
ENSG00000113163 10087   Hs.270437       NM_005713       ENSG00000113163         COL4A3BP
DB065460        9947    Hs.132194       NM_005462       ENSG00000155495         MAGEC1
ENSP00000282466 285313  Hs.58561        NM_178822       ENSG00000152580         IGSF10
DB029361        22849   Hs.131683       NM_014912       ENSG00000107864         CPEB3
XP_016877211    87      Hs.235750       NM_001102       ENSG00000072110         ACTN1
EAW77897        56965   Hs.270244       NM_020213       ENSG00000137817         PARP6

human.description記錄表了基因的功能描述,類別等信息,示意如下

如何使用homer進行peak注釋

2. 進行注釋

用法如下

annotatePeaks.pl peak.bed hg19 > peak.annotation.xls

第一個參數(shù)為peak的bed文件,第二個參數(shù)為參考基因組的名稱。輸出結(jié)果如下所示

如何使用homer進行peak注釋

注釋的內(nèi)容包含兩個部分,第一部分是距離peak區(qū)間最近的轉(zhuǎn)錄起始位點TSS,第二部分是對peak在基因組區(qū)域的分布,比如TSS,TTS,3’UTR,5’UTR等區(qū)域。

到此,相信大家對“如何使用homer進行peak注釋”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI