您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“如何使用UPORA對peak進行注釋”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“如何使用UPORA對peak進行注釋”吧!
UROPA是一個命令行工具,可以對基因組區(qū)域進行注釋,這里的基因組區(qū)域要求是BED格式,比如chip,ATAC_seq等數(shù)據(jù)產(chǎn)生的peak區(qū)間。同時需要提供一個GTF格式的基因組注釋信息,比如從UCSC,ensemble,ncbi等數(shù)據(jù)庫下載的參考基因組文件。在注釋結(jié)果中不僅給出了peak在基因組中的定位,還會給出對應(yīng)的正負鏈,與基因的距離,對應(yīng)的基因類型等較為全面的注釋信息。官方文檔網(wǎng)址如下
https://uropa-manual.readthedocs.io/introduction.html
該軟件根據(jù)peak的中心與基因的相對位置,將peak的基因組定位劃分為以下幾種類型,示意如下
提供了多種安裝方式,這里我采用的是直接拉取官方的docker鏡像,用法如下
docker pull loosolab/uropa
該軟件需要三個輸入文件:
GTF格式的注釋文件
BED格式的peak文件
JSON格式的配置文件
用法也比較簡便, 我使用官方的是測試數(shù)據(jù),步驟如下
wget ftp://ftp.ensembl.org/pub/release-75/gtf/homo_sapiens/Homo_sapiens.GRCh47.75.gtf.gz
gunzip Homo_sapiens.GRCh47.75.gtf.gz
wget https://www.encodeproject.org/files/ENCFF966LMJ/@@download/ENCFF966LMJ.bed.gz
gunzip ENCFF966LMJ.bed.gz
配置文件內(nèi)容如下
{
"queries": [
{"feature":"gene", "distance":5000, "feature.anchor": "start", "show.attributes":"gene_name"},
{"feature": "gene","distance":5000, "feature.anchor":"center"}],
"priority" : "False",
"gtf": "/home/soft/uropa/Homo_sapiens.GRCh47.75.gtf",
"bed": "/home/soft/research/uropa/ENCFF966LMJ.bed"
}
配置文件命名為config.json, 代碼如下
docker run \
--rm \
-v /home:/home \
loosolab/uropa \
uropa \
-i /home/soft/uropa/config.json
\-p /home/soft/uropa/uropa
-i
參數(shù)指定配置文件的路徑,-p
指定輸出文件的前綴。輸出文件如下
├── uropa_allhits.txt
├── uropa_besthits.txt
└── uropa_finalhits.txt
這三個文件內(nèi)容相同,只是行數(shù)不同,內(nèi)容示意如下
軟件會自動給每一個peak一個id, 可以直觀的看到peak與基因之間的關(guān)系,更多用法和細節(jié)請參考官方文檔。
到此,相信大家對“如何使用UPORA對peak進行注釋”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。