溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何使用CIRCexplorer2識別環(huán)狀RNA

發(fā)布時間:2021-07-28 18:52:32 來源:億速云 閱讀:287 作者:chen 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“如何使用CIRCexplorer2識別環(huán)狀RNA”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習(xí)“如何使用CIRCexplorer2識別環(huán)狀RNA”吧!

CIRCexplorer是一款環(huán)狀RNA預(yù)測軟件,專門用于預(yù)測exonic circRNA,網(wǎng)址如下

https://github.com/YangLab/CIRCexplorer2

環(huán)狀RNA的識別包含了序列比對和環(huán)狀RNA預(yù)測兩步,該軟件目前更新到了v2版本,相比v1版本,用法有較大變化。在v1版本中只支持tophat-fusion和STAR兩款軟件進行序列比對來識別junction reads,在v2版本中,擴展到了以下5種軟件

  1. Tophat-Fusion

  2. STAR

  3. BWA

  4. MapSplice

  5. segemehl


v1版本中所有命令封裝在一個腳本中,v2版本也進行了改進,同時提供了單腳本一鍵化運行和分模塊運行兩種方式,保證了軟件使用的簡便性和靈活性。

該軟件的安裝相對而言,略顯復(fù)雜,因為依賴的軟件特別多,這里我直接把我在docker進行中的安裝命令貼上來,供大家參考

docker run -it centos
yum install -y epel-release
yum install -y gcc gcc-c++  make zlib zlib-devel bzip2 bzip2-devel python2 python2-pip python-devel xz xz-devel unzip which ncurses-devel ncurses
# CIRCexplorer2
pip install circexplorer2
# tophat & tophat-fusion
wget http://ccb.jhu.edu/software/tophat/downloads/tophat-2.1.1.Linux_x86_64.tar.gz
tar xvzf tophat-2.1.1.Linux_x86_64.tar.gz
cd tophat-2.1.1.Linux_x86_64
cp b* c* f* g* j* long_spanning_reads map2gtf prep_reads sam* segment_juncs sra_to_solid tophat* /usr/local/bin/
# cufflinks
wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
tar xzvf cufflinks-2.2.1.Linux_x86_64.tar.gz
cp * /usr/local/bin/
# bedtools
wget https://github.com/arq5x/bedtools2/releases/download/v2.25.0/bedtools-2.25.0.tar.gz
tar -zxvf bedtools-2.25.0.tar.gz
cd bedtools2
make
cd bin
cp * /usr/local/bin/
# UCSC
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/genePredToGtf
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/gtfToGenePred
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedGraphToBigWig
wget http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/bedToBigBed
chmod +x bedGraphToBigWig bedToBigBed genePredToGtf gtfToGenePred
mv  bedGraphToBigWig bedToBigBed genePredToGtf gtfToGenePred /usr/local/bin/
# star
wget https://github.com/alexdobin/STAR/archive/2.7.0d.tar.gz
tar xzvf  2.7.0d.tar.gz
cd STAR-2.7.0d/bin
cd Linux_x86_64_static
cp * /usr/local/bin/
# bwa
wget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.17.tar.bz2
tar xjvf bwa-0.7.17.tar.bz2
cd bwa-0.7.17
make
cp bwa /usr/local/bin/
# mapsplice
wget http://protocols.netlab.uky.edu/~zeng/MapSplice-v2.1.7.zip
unzip MapSplice-v2.1.7.zip
cd MapSplice-v2.1.7
make
# segemehl
wget https://github.com/samtools/htslib/releases/download/1.9/htslib-1.9.tar.bz2
tar xjvf htslib-1.9.tar.bz2
cd htslib-1.9
./configure
make
make install
wget http://www.bioinf.uni-leipzig.de/Software/segemehl/downloads/segemehl-0.3.4.tar.gz
tar xzvf segemehl-0.3.4.tar.gz
cd segemehl-0.3.4
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/:$PKG_CONFIG_PATH
make
cp segemehl.x  /usr/local/bin/

相比安裝,軟件的使用過程就顯得簡單多了,該軟件分為以下5個功能模塊

  1. Align

  2. Parse

  3. Annotate

  4. Assemble

  5. Denovo


Align用于將序列比對到參考基因組上;Parse用于從比對結(jié)果中挑選junction reads;Annotate用于預(yù)測環(huán)狀RNA;Assemble用于組裝環(huán)狀RNA的轉(zhuǎn)錄本序列;Denovo根據(jù)序列組裝結(jié)果,識別新的環(huán)狀RNA和分析環(huán)狀RNA上的可變剪切事件。具體用法如下

1. Align

雖然支持多款序列比對軟件,但是由于tophat的結(jié)果更方便后續(xù)的cufflinks軟件進行分析,官方推薦使用tophat來進行比對。針對單端序列的比對,代碼如下

CIRCexplorer2 align \
-G hg19.gtf \
-i bowtie1_index \
-j bowtie2_index \
-f RNA_seq.fastq \
> CIRCexplorer2_align.log

值得注意的是,align模塊僅提供了針對單端序列使用tophat進行比對的功能,如果你是雙端測序的結(jié)果或者想要使用其他軟件,只能是自己手工進行比對,這里比較推薦STAR軟件,速度較快,缺點就是內(nèi)存消耗較大。

2. parse

parse用于解析序列比對的結(jié)果,支持多款軟件,以常用的STAR為例,代碼如下

CIRCexplorer2 parse \
-t STAR \
Chimeric.out.junction \
> CIRCexplorer2_parse.log

對于其他軟件的用法,具體請參考官方文檔,無論是什么比對軟件,該命令最終都會生成以下文件

back_spliced_junction.bed
3. annotation

這一步就是根據(jù)已知的線性轉(zhuǎn)錄本信息,識別環(huán)狀RNA,所以需要提供參考基因組對應(yīng)的注釋文件,官方也提供了腳本來幫助我們下載,用法如下

fetch_ucsc.py hg19 ref hg19_ref.txt

預(yù)測環(huán)狀RNA的代碼如下

CIRCexplorer2 annotate \
-r hg19_ref.txt \
-g hg19.fa \
-b back_spliced_junction.bed \
-o circularRNA_known.txt \
> CIRCexplorer2_annotate.log

-o參數(shù)為輸出結(jié)果,內(nèi)容示意如下

如何使用CIRCexplorer2識別環(huán)狀RNA

每列的含義如下所示

如何使用CIRCexplorer2識別環(huán)狀RNA

由于后續(xù)的兩個模塊只能處理tophat的結(jié)果,我用的是STAR測試的,所以這里就不描述其用法了。

如果你只是想要使用這個軟件來預(yù)測環(huán)狀RNA,那么多款序列比對軟件都可以選擇,但是你想要使用完整功能,則必須使用tophat來進行比對。

到此,相信大家對“如何使用CIRCexplorer2識別環(huán)狀RNA”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI