您好,登錄后才能下訂單哦!
怎么使用muscle進(jìn)行多序列比對(duì),針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
muscle是最為廣泛使用的多序列比對(duì)工具之一,其速度和準(zhǔn)確度比clustal都要更加優(yōu)秀,在幾秒鐘的時(shí)間就可以完成上百條序列的比對(duì),而且用法簡(jiǎn)單。
在下載頁(yè)面,提供了多個(gè)操作系統(tǒng)的可執(zhí)行文件。
linux下安裝的代碼如下
wget https://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gz tar xzvf muscle3.8.31_i86linux64.tar.gz mv muscle3.8.31_i86linux64 muscle chmod +x muscle
由于解壓后的文件名很長(zhǎng),這里對(duì)文件進(jìn)行了重命名,然后添加了可執(zhí)行權(quán)限。為了方便調(diào)用,可以將該文件添加到PATH環(huán)境變量中。muscle的基本用法如下
muscle -in seqs.fa -out seqs.afa
輸入序列為FASTA格式,如果輸入序列中出現(xiàn)了gap, 會(huì)先去除這些gap, 然后在進(jìn)行多序列比對(duì)。默認(rèn)輸出的比對(duì)結(jié)果也為fasta格式,也支持phylip
, msf
, clustalw
等其他格式。
除了多序列比對(duì)外,muscle還可以構(gòu)建進(jìn)化樹(shù),支持以下兩種建樹(shù)方式
NJ
UPGMA
NJ法構(gòu)建的進(jìn)化樹(shù)可信度更高,而UPGMA建樹(shù)的速度更快。基本用法如下
muscle -maketree -in seqs.afa -out seqs.phy -cluster neighborjoining
-cluster
參數(shù)指定建樹(shù)的方法,默認(rèn)為upgma。輸出的tree文件格式為Newick格式。
muscle的默認(rèn)參數(shù)設(shè)置最大化的保證了比對(duì)的準(zhǔn)確度,對(duì)于大的序列,如果比對(duì)速度不是很理想時(shí),可以適當(dāng)?shù)恼{(diào)整參數(shù)。
對(duì)于核酸和氨基酸序列,官方分別推薦了速度最快的參數(shù)設(shè)置。
核酸
muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags
氨基酸
muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags -sv -distance1 kbit20_3
使用muscle時(shí),其默認(rèn)參數(shù)設(shè)置就能夠滿足絕大部分的使用場(chǎng)景,只有對(duì)于較大的輸入序列,才需要調(diào)整參數(shù)。
EBI提供了muscle的在線服務(wù),網(wǎng)址如下
https://www.ebi.ac.uk/Tools/msa/muscle/
用法和clustal的用法是類似的,這里就不贅述了。對(duì)于500條以下而且數(shù)據(jù)量小于1Mb的序列,可以直接使用該在線服務(wù)。
關(guān)于怎么使用muscle進(jìn)行多序列比對(duì)問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。