溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

fusioncatcher中怎么實(shí)現(xiàn)融合基因操作

發(fā)布時(shí)間:2021-08-12 16:56:14 來源:億速云 閱讀:202 作者:Leah 欄目:大數(shù)據(jù)

本篇文章為大家展示了fusioncatcher中怎么實(shí)現(xiàn)融合基因操作,內(nèi)容簡明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。

1. 準(zhǔn)備參考基因組

fusioncatcher也提供了準(zhǔn)備參考基因組的腳本,該腳本會(huì)從Ensembl等網(wǎng)站自動(dòng)下載數(shù)據(jù),所以使用時(shí)需要聯(lián)網(wǎng),用法如下

fusioncatcher-build -g mus_musculus -o /db/mouse -w asia.ensembl.org

-g參數(shù)指定參考基因組的物種名稱,-o指定輸出結(jié)果的目錄,-w參數(shù)指定ensembl web service, 即biomart的的網(wǎng)址。需要注意的是,-w參數(shù)一定要設(shè)置成上述示例中的樣子,默認(rèn)參數(shù)是不可以的,另外對(duì)于人和小鼠而言,因?yàn)闀?huì)從gencode數(shù)據(jù)庫下載文件,而gencode的FTP地址發(fā)生了變動(dòng),所以要手動(dòng)修改源代碼中g(shù)encode的FTP地址。

對(duì)于-o參數(shù)的取值,可以參考如下鏈接

ftp://ftp.ensembl.org/pub/current_fasta

該目錄下每個(gè)物種對(duì)應(yīng)一個(gè)文件夾,fusioncatcher就是根據(jù)-o參數(shù)的取值來下載對(duì)應(yīng)物種的序列。

除了下載文件,該步驟還包括建立索引等費(fèi)時(shí)較長的步驟,所以這一步的運(yùn)行時(shí)間會(huì)比較久,需要5-10個(gè)小時(shí)。

對(duì)于human而言,官方提供基于Ensembl release 90版本建立的數(shù)據(jù)庫,下載方式如下

mkdir -p /some/human/data/
cd /some/human/data/
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.aa
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ab
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ac
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ad
cat human_v90.tar.gz.* | tar xz
ln -s human_v90 current
2. 運(yùn)行

用法如下

fusioncatcher \
-d  database_directory  \
-i   fastq_directory  \
-o  output_directory

-d參數(shù)指定物種的參考基因組所在目錄,-i參數(shù)指定樣本對(duì)應(yīng)的原始測序數(shù)據(jù)fastq文件所在目錄,-o參數(shù)指定輸出結(jié)果的目錄。

對(duì)于原始序列所在的目錄,在該目錄下可以同時(shí)存在多個(gè)樣本的結(jié)果,軟件會(huì)自動(dòng)識(shí)別不同樣本對(duì)應(yīng)的R1和R2端數(shù)據(jù)。

由于fusioncatcher內(nèi)置了質(zhì)量控制的程序,會(huì)自動(dòng)對(duì)fastq文件進(jìn)行去除adapter,去除低質(zhì)量等分析,所以我們只需要提供原始的測序數(shù)據(jù)就可以了。

在輸出目錄中,final-list_candidate-fusion-genes.txt 就是最終預(yù)測到的所有融合基因,這個(gè)目錄下文件很多,每個(gè)文件的詳細(xì)解釋可以參考官方文檔。


上述內(nèi)容就是fusioncatcher中怎么實(shí)現(xiàn)融合基因操作,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI