溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么使用tophat-fusion鑒定融合基因

發(fā)布時間:2021-11-10 16:53:51 來源:億速云 閱讀:198 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)怎么使用tophat-fusion鑒定融合基因,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

tophat-fusion 是一款利用RNA_seq 數(shù)據(jù)鑒定融合基因的工具。

該軟件是集成在tophat軟件中的,只需要安裝好tophat之后就可以使用了,使用方法也比較簡單,唯一需要注意的是目錄結(jié)構(gòu)。

tophat-fusion要求固定的目錄結(jié)構(gòu),比如我在result文件夾下進(jìn)行tophat-fusion的分析, 那么我需要在該目錄下準(zhǔn)備以下幾個文件

  1. 物種對應(yīng)的refGene.txt 和 ensGene.txt, 這兩個文件可以從UCSC下載得到

  2. 新建一個blast 文件夾,注意文件夾的名字必須為”blast”, 在blast 文件夾下需要從NCBI下載nt, human_genomic, other_genomic開頭的所有文件,下載的鏈接如下:

    ftp://ftp.ncbi.nlm.nih.gov/blast/db/

  3. 結(jié)果輸出目錄,每個樣本對應(yīng)一個輸出目錄,輸出目錄的前綴為tophat_, 下劃線之后加上樣本名稱,類似tophat_MCF,MCF為樣本的名字

當(dāng)然你還需要物種對應(yīng)的bowtie1的索引文件,注意這里必須為bowtie1的索引, tophat檢測融合基因時推薦bowtie1的索引方式。

上述文件都準(zhǔn)備好之后,就可以開始分析了,步驟如下

1. 比對參考基因組

第一步其實(shí)就是利用tophat將reads比對到參考基因組上,只不過對于融合基因的reads而言,其比對方式比較特殊,需要添加額外的參數(shù),具體代碼如下

tophat2 -o tophat_MCF7 -p 20 --fusion-search --keep-fasta-order --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --max-intron-length 100000 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM hg19_bowtie1/hg19 SRR064286_1.fastq SRR064286_2.fastq
2. 生成結(jié)果

result目錄下,直接運(yùn)行如下代碼就可以了

tophat-fusion-post -p 20 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 hg19_bowtie1/hg19

默認(rèn)處理的是human的融合基因,如果是其他物種,需要添加--non-human參數(shù)。

tophat-fusion會根據(jù)目錄結(jié)構(gòu)自動識別對應(yīng)的樣本, 運(yùn)行完成之后,會生成一個名為tophatfusion_out的文件夾,該文件夾下是所有樣本的融合基因分析結(jié)果。

我們只需要看其中的result.html文件就可以了,內(nèi)容示意如下

怎么使用tophat-fusion鑒定融合基因

每一列的含義如下

  1. Sample name in which a fusion is identified

  2. Gene on the “l(fā)eft” side of the fusion

  3. Chromosome ID on the left

  4. Coordinates on the left

  5. Gene on the “right” side

  6. Chromosome ID on the right

  7. Coordinates on the right

  8. Number of spanning reads

  9. Number of spanning mate pairs

  10. Number of spanning mate pairs where one end spans a fusion


相比fusionmap, 該軟件的運(yùn)行時間特別的長。

上述就是小編為大家分享的怎么使用tophat-fusion鑒定融合基因了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI