您好,登錄后才能下訂單哦!
怎樣使用Clustal進(jìn)行多序列比對(duì),相信很多沒(méi)有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法,通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。
多序列比對(duì)在保守區(qū)域鑒定,系統(tǒng)發(fā)育分析,motif識(shí)別等多個(gè)領(lǐng)域發(fā)揮重要作用,是生物信息數(shù)據(jù)分析必備的基礎(chǔ)技能之一。Clustal是一款經(jīng)典的多序列比對(duì)工具,支持DNA, RNA, 蛋白質(zhì)的比對(duì)。
clustal 有兩個(gè)版本可用,之前的版本同時(shí)提供了GUI和命令行兩種工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。
最新本的omega比對(duì)準(zhǔn)確度更高,而且速度更快,適合幾千條規(guī)模的多序列比對(duì),該軟件目前只提供了命令行版本。在官網(wǎng)上,提供了源代碼和編譯好的二進(jìn)制文件
通常情況下,直接下載對(duì)應(yīng)的二進(jìn)制可執(zhí)行文件就行了。軟件的基本用法如下:
clustalo -i seq.fasta > align.fa
-i
指定輸入的序列文件,默認(rèn)輸出結(jié)果打印在屏幕上,可以重定向到指定文件中。該軟件支持多種格式的輸出
fasta
clustal
msf
phylip
selex
stockholm
vienna
默認(rèn)輸出格式為fasta
, 可以通過(guò)--outfmt
參數(shù)指定輸出文件的格式。多序列比對(duì)不同于Blast的地方在于,Blast是局部比對(duì),而多序列比對(duì)是全局比對(duì)。全局比對(duì)意味著需要將輸入序列對(duì)齊到同一個(gè)水平來(lái)比對(duì),一般是通過(guò)在輸入序列中插入堿基的方式來(lái)使序列對(duì)齊,示意如下
>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT GACCTCCAAATACCGTTAA >ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT GACCTCCAAGTACCGTTAA >ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT CTCTGAGAAGTACCGCTAA
通過(guò)在序列中插入-
來(lái)使得序列對(duì)齊。如果不習(xí)慣命令行的操作方式,也有在線服務(wù)可以使用。EBI提供的在線服務(wù)網(wǎng)址如下
https://www.ebi.ac.uk/Tools/msa/clustalo/
使用非常簡(jiǎn)單,輸入序列,調(diào)整參數(shù)設(shè)置,然后提交即可。在輸出結(jié)果中,還提供了顏色標(biāo)記,進(jìn)化樹可視化等功能。
通過(guò)Mview
可視化多序列比對(duì)結(jié)果,示意如下
也支持導(dǎo)出到Jalview
軟件中進(jìn)行可視化。
通過(guò)Phylogenetic Tree
可以查看進(jìn)化樹的結(jié)果,默認(rèn)采用NJ法建樹,示意如下
也可以通過(guò)Send to Simple Phylogeny, 創(chuàng)建進(jìn)化樹,支持NJ和UPGMA兩種建樹方式。
看完上述內(nèi)容,你們掌握怎樣使用Clustal進(jìn)行多序列比對(duì)的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。