溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

soapdenovo2怎么安裝配置

發(fā)布時(shí)間:2021-12-18 14:58:35 來(lái)源:億速云 閱讀:549 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹“soapdenovo2怎么安裝配置”,在日常操作中,相信很多人在soapdenovo2怎么安裝配置問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”soapdenovo2怎么安裝配置”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

soapdenovo是由華大開(kāi)發(fā)的組裝工具,主要用于動(dòng)植物基因組等大型基因組的組裝,也可以用于細(xì)菌/真菌基因組組裝。對(duì)于大型基因組裝而言,需要的硬件資源特別多,建議內(nèi)存在150G以上。

安裝過(guò)程如下

wget https://github.com/aquaskyline/SOAPdenovo2/archive/r241.tar.gz
tar xzvf r241.tar.gz
cd SOAPdenovo2-r241/
make

編譯成功后,會(huì)生成如下3個(gè)可執(zhí)行文件

  1. SOAPdenovo-63mer

  2. SOAPdenovo-127mer

  3. SOAPdenovo-fusion

前2個(gè)可執(zhí)行文件用于組裝, 63mer代表支持的kmer最大長(zhǎng)度為63,127mer代表支持的kmer最大長(zhǎng)度為127,除了支持的kmer長(zhǎng)度不同外,其他用法完全
相同。

SOAPdenovo由以下幾個(gè)子命令構(gòu)成

  1. pregraph

  2. sparse_pregraph

  3. contig

  4. map

  5. scaff

  6. all


前5個(gè)子命令對(duì)應(yīng)了soapdenovo組裝的5個(gè)步驟,all命令表示一次執(zhí)行以上的5個(gè)步驟;在組裝時(shí),既可以依次執(zhí)行每一個(gè)步驟,也可以直接使用all命令,一次運(yùn)行所有步驟。

soapdenovo需要一個(gè)配置文件,配置文件分成兩個(gè)部分,全局配置和每個(gè)文庫(kù)的配置。全局配置目前只有一個(gè)參數(shù)max_rd_len, 如果序列大于該長(zhǎng)度,會(huì)被切成該長(zhǎng)度,然后在分析。

每個(gè)文庫(kù)的配置以[LIB]開(kāi)頭,主要指定輸入文件的路徑,支持多種格式的輸入文件,用不同的前綴表示, q代表輸入序列為fastq格式;f代筆輸入序列為fasta格式,b代表輸入文件為bam格式,對(duì)于雙端數(shù)據(jù),分別用后綴12表示R1端和R2端的reads。

除了輸入文件路徑外,還包含以下幾個(gè)參數(shù)的設(shè)置

  1. avg_ins
    文庫(kù)插入片段的平均長(zhǎng)度,在實(shí)際設(shè)置時(shí),可以參考文庫(kù)size分布圖,取峰值即可

  2. reverse_seq
    是否需要將序列反向互補(bǔ),對(duì)于pair-end數(shù)據(jù),不需要反向互補(bǔ),設(shè)置為0;對(duì)于mate-pair數(shù)據(jù),需要反向互補(bǔ),設(shè)置為1

  3. asm_flags
    1表示只組裝contig. 2表示只組裝scaffold,3表示同時(shí)組裝contig和scaffold,4表示只補(bǔ)gap

  4. rd_len_cutof
    序列長(zhǎng)度閾值,作用和max_rd_len相同,大于該長(zhǎng)度的序列會(huì)被切除到該長(zhǎng)度

  5. rank
    設(shè)置不同文庫(kù)數(shù)據(jù)的優(yōu)先級(jí)順序,取值范圍為整數(shù),rank值相同的多個(gè)文庫(kù),在組裝scaffold時(shí),會(huì)同時(shí)使用。

  6. pair_num_cutoff
    contig或者scaffold之前的最小overlap個(gè)數(shù),對(duì)于pair-end數(shù)據(jù),默認(rèn)值為3;對(duì)于mate-paird數(shù)據(jù),默認(rèn)值為5

  7. map_len
    比對(duì)長(zhǎng)度的最小閾值,對(duì)于pair-end數(shù)據(jù),默認(rèn)值為32;對(duì)于mate-pair數(shù)據(jù),默認(rèn)值為35


配置文件示例如下

max_rd_len=100
[LIB]
avg_ins=200
reverse_seq=0
asm_flags=3
rd_len_cutoff=100
rank=1
q1=fastq1_read_1.fq
q2=fastq1_read_2.fq

軟件基本用法如下

SOAPdenovo-63mer all -s config_file -K 63 -R -o graph_prefix

運(yùn)行成功后,會(huì)生成很多文件,其中有兩個(gè)文件是組裝的結(jié)果,后綴分別為contigscafSeq,對(duì)應(yīng)contig和scaffold。

到此,關(guān)于“soapdenovo2怎么安裝配置”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI