您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“如何使用GetOrganelle軟件組裝葉綠體基因組”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“如何使用GetOrganelle軟件組裝葉綠體基因組”吧!
現(xiàn)在做植物的葉綠體基因組基本上都是直接以新鮮葉片做材料,提取總DNA測序,構(gòu)建二代測序文庫,然后利用現(xiàn)成的軟件組裝葉綠體基因組,省去了提取葉綠體的步驟
利用總DNA測序的數(shù)據(jù)組裝葉綠體基因組的軟件很多,有一篇綜述介紹這些工具
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02153-6
今天這篇推文我使用 GetOrganelle 這個(gè)軟件,軟件的Github鏈接 https://github.com/Kinggerm/GetOrganelle
對應(yīng)的論文
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02154-5
軟件的github主頁對軟件的使用方法介紹的很詳細(xì),這款軟件是昆明植物所的老師開發(fā)的,還開設(shè)了qq群進(jìn)行答疑,qq群號在gitbub的主頁末尾可以看到
安裝直接使用conda,非常容易
conda install -c bioconda getorganelle
想要在linux系統(tǒng)下使用conda命令需要安裝miniconda或者Anaconda3,我之前錄制過一期視頻介紹linux系統(tǒng)安裝 Anaconda3,不熟悉的可以找來看看 https://www.bilibili.com/video/BV1Ft4y1e7w2
軟件安裝好以后還得下載參考基因組,運(yùn)行如下命令
組裝用到的命令是get_organelle_from_reads.py
,使用到的參數(shù)有
-1 -2 分別制定雙端測序數(shù)據(jù)的路徑
-o 制定輸出文件的文件名
-R -k 具體是什么意思我還不知道,-R按照幫助文檔直接設(shè)置15應(yīng)該就可以,-k后面接的數(shù)字也可以按照他幫助文檔的來設(shè)置,現(xiàn)在雙端測序通常是150bp,這個(gè)-k參數(shù)直接設(shè)置105和121就可以,這個(gè)數(shù)字少一點(diǎn),速度應(yīng)該會(huì)快一點(diǎn)。
-F 指定參考,如果是葉綠體基因組后面直接跟 embplant_pt 就可以
因?yàn)槿~綠體基因組的拷貝數(shù)高,基本上2G的數(shù)據(jù)量就夠組裝得到完整基因組用的了。所以直接用head命令取全基因組測序數(shù)據(jù)的前2千萬行就夠了
head -n 20000000 data_R1.fastq > R1.fastq
head -n 20000000 data_R2.fastq > R2.fastq
最后是組裝
get_organelle_from_reads.py -1 R1.fastq -2 R2.fq -o plastome_output -R 15 -k 105,121 -F embplant_pt
如果組裝成功最后會(huì)得到兩條序列,這兩條序列差別在小單拷貝區(qū)方向不同,我自己的處理方式是選一些近緣的參考葉綠體基因組來構(gòu)建進(jìn)化樹,去掉枝長明顯過長的那一個(gè)。
到此,相信大家對“如何使用GetOrganelle軟件組裝葉綠體基因組”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。