您好,登錄后才能下訂單哦!
這篇文章主要介紹“soapdenovo2怎么安裝配置”,在日常操作中,相信很多人在soapdenovo2怎么安裝配置問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”soapdenovo2怎么安裝配置”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
soapdenovo是由華大開(kāi)發(fā)的組裝工具,主要用于動(dòng)植物基因組等大型基因組的組裝,也可以用于細(xì)菌/真菌基因組組裝。對(duì)于大型基因組裝而言,需要的硬件資源特別多,建議內(nèi)存在150G以上。
安裝過(guò)程如下
wget https://github.com/aquaskyline/SOAPdenovo2/archive/r241.tar.gz tar xzvf r241.tar.gz cd SOAPdenovo2-r241/ make
編譯成功后,會(huì)生成如下3個(gè)可執(zhí)行文件
SOAPdenovo-63mer
SOAPdenovo-127mer
SOAPdenovo-fusion
前2個(gè)可執(zhí)行文件用于組裝, 63mer
代表支持的kmer最大長(zhǎng)度為63,127mer
代表支持的kmer最大長(zhǎng)度為127,除了支持的kmer長(zhǎng)度不同外,其他用法完全
相同。
SOAPdenovo由以下幾個(gè)子命令構(gòu)成
pregraph
sparse_pregraph
contig
map
scaff
all
前5個(gè)子命令對(duì)應(yīng)了soapdenovo組裝的5個(gè)步驟,all
命令表示一次執(zhí)行以上的5個(gè)步驟;在組裝時(shí),既可以依次執(zhí)行每一個(gè)步驟,也可以直接使用all
命令,一次運(yùn)行所有步驟。
soapdenovo需要一個(gè)配置文件,配置文件分成兩個(gè)部分,全局配置和每個(gè)文庫(kù)的配置。全局配置目前只有一個(gè)參數(shù)max_rd_len
, 如果序列大于該長(zhǎng)度,會(huì)被切成該長(zhǎng)度,然后在分析。
每個(gè)文庫(kù)的配置以[LIB]
開(kāi)頭,主要指定輸入文件的路徑,支持多種格式的輸入文件,用不同的前綴表示, q
代表輸入序列為fastq格式;f
代筆輸入序列為fasta格式,b
代表輸入文件為bam格式,對(duì)于雙端數(shù)據(jù),分別用后綴1
和2
表示R1端和R2端的reads。
除了輸入文件路徑外,還包含以下幾個(gè)參數(shù)的設(shè)置
avg_ins
文庫(kù)插入片段的平均長(zhǎng)度,在實(shí)際設(shè)置時(shí),可以參考文庫(kù)size分布圖,取峰值即可
reverse_seq
是否需要將序列反向互補(bǔ),對(duì)于pair-end數(shù)據(jù),不需要反向互補(bǔ),設(shè)置為0;對(duì)于mate-pair數(shù)據(jù),需要反向互補(bǔ),設(shè)置為1
asm_flags
1表示只組裝contig. 2表示只組裝scaffold,3表示同時(shí)組裝contig和scaffold,4表示只補(bǔ)gap
rd_len_cutof
序列長(zhǎng)度閾值,作用和max_rd_len相同,大于該長(zhǎng)度的序列會(huì)被切除到該長(zhǎng)度
rank
設(shè)置不同文庫(kù)數(shù)據(jù)的優(yōu)先級(jí)順序,取值范圍為整數(shù),rank值相同的多個(gè)文庫(kù),在組裝scaffold時(shí),會(huì)同時(shí)使用。
pair_num_cutoff
contig或者scaffold之前的最小overlap個(gè)數(shù),對(duì)于pair-end數(shù)據(jù),默認(rèn)值為3;對(duì)于mate-paird數(shù)據(jù),默認(rèn)值為5
map_len
比對(duì)長(zhǎng)度的最小閾值,對(duì)于pair-end數(shù)據(jù),默認(rèn)值為32;對(duì)于mate-pair數(shù)據(jù),默認(rèn)值為35
配置文件示例如下
max_rd_len=100 [LIB] avg_ins=200 reverse_seq=0 asm_flags=3 rd_len_cutoff=100 rank=1 q1=fastq1_read_1.fq q2=fastq1_read_2.fq
軟件基本用法如下
SOAPdenovo-63mer all -s config_file -K 63 -R -o graph_prefix
運(yùn)行成功后,會(huì)生成很多文件,其中有兩個(gè)文件是組裝的結(jié)果,后綴分別為contig
和scafSeq
,對(duì)應(yīng)contig和scaffold。
到此,關(guān)于“soapdenovo2怎么安裝配置”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。