溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎樣使用Clustal進(jìn)行多序列比對(duì)

發(fā)布時(shí)間:2021-11-10 17:04:53 來(lái)源:億速云 閱讀:1041 作者:柒染 欄目:大數(shù)據(jù)

怎樣使用Clustal進(jìn)行多序列比對(duì),相信很多沒(méi)有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策,為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法,通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。


多序列比對(duì)在保守區(qū)域鑒定,系統(tǒng)發(fā)育分析,motif識(shí)別等多個(gè)領(lǐng)域發(fā)揮重要作用,是生物信息數(shù)據(jù)分析必備的基礎(chǔ)技能之一。Clustal是一款經(jīng)典的多序列比對(duì)工具,支持DNA, RNA, 蛋白質(zhì)的比對(duì)。

clustal 有兩個(gè)版本可用,之前的版本同時(shí)提供了GUI和命令行兩種工具,GUI版的叫做ClustalX, 命令行版叫做ClustalW; 最新版本叫做Omega, 只提供了命令行版。

怎樣使用Clustal進(jìn)行多序列比對(duì)

最新本的omega比對(duì)準(zhǔn)確度更高,而且速度更快,適合幾千條規(guī)模的多序列比對(duì),該軟件目前只提供了命令行版本。在官網(wǎng)上,提供了源代碼和編譯好的二進(jìn)制文件
怎樣使用Clustal進(jìn)行多序列比對(duì)

通常情況下,直接下載對(duì)應(yīng)的二進(jìn)制可執(zhí)行文件就行了。軟件的基本用法如下:

clustalo -i seq.fasta > align.fa

-i指定輸入的序列文件,默認(rèn)輸出結(jié)果打印在屏幕上,可以重定向到指定文件中。該軟件支持多種格式的輸出

  1. fasta

  2. clustal

  3. msf

  4. phylip

  5. selex

  6. stockholm

  7. vienna


默認(rèn)輸出格式為fasta, 可以通過(guò)--outfmt參數(shù)指定輸出文件的格式。多序列比對(duì)不同于Blast的地方在于,Blast是局部比對(duì),而多序列比對(duì)是全局比對(duì)。全局比對(duì)意味著需要將輸入序列對(duì)齊到同一個(gè)水平來(lái)比對(duì),一般是通過(guò)在輸入序列中插入堿基的方式來(lái)使序列對(duì)齊,示意如下

>ENA|CAA23748|CAA23748.1 Homo sapiens (human) alpha globin
ATGGTGCTGTCTCCTG----CCGACAAGACCAACGTCAAGGCCGCCTGGGGTAAGGTCGG
CGCGCACGCTGGCGAGTATGGTGCGGAGGCCCTGGAGAGGATGTTCCTGTCCTTCCCCAC
CACCAAGACCTACTTCCCGCACTTC---GACCTGAGCCACGGCTCTGCCCAAGTTAAGGG
CCACGGCAAGAAGGTGGCCGACGCGCTGACCAACGCCGTGGCGCACGTGGACGACATGCC
CAACGCGCTGTCCGCCCTGAGCGACCTGCACGCGCACAAGCTTCGGGTGGACCCGGTCAA
CTTCAAGCTCCTAAGCCACTGCCTGCTGGTGACCCTGGCCGCCCACCTCCCCGCCGAGTT
CACCCCTGCGGTGCACGCTTCCCTGGACAAGTT---CCTGGCTTCTGTGAGCACCGTGCT
GACCTCCAAATACCGTTAA
>ENA|CAA24095|CAA24095.1 Mus musculus (house mouse) alpha-globin
ATGGTGCTCTCTGGGGAAGACAAAAG----CAACATCAAGGCTGCCTGGGGGAAGATTGG
TGGCCATGGTGCTGAATATGGAGCTGAAGCCCTGGAAAGGATGTTTGCTAGCTTCCCCAC
CACCAAGACCTACTTTCCTCACTTTGATGT---AAGCCACGGCTCTGCCCAGGTCAAGGG
TCACGGCAAGAAGGTCGCCGATGCGCTGGCCAGTGCTGCAGGCCACCTCGATGACCTGCC
CGGTGCCTTGTCTGCTCTGAGCGACCTGCATGCCCACAAGCTGCGTGTGGATCCCGTCAA
CTTCAAGCTCCTGAGCCACTGCCTGCTGGTGACCTTGGCTAGCCACCACCCTGCCGATTT
CACCCCCGCGGTACATGCCTCTCTGGACAAATT---CCTTGCCTCTGTGAGCACCGTGCT
GACCTCCAAGTACCGTTAA
>ENA|BAA20512|BAA20512.1 Cyprinus carpio (common carp) alpha-globin
ATGAGTCTCTCTGATAAGGACAAGGCTG----CTGTGAAAGCCCTATGGGCTAAGATCAG
CCCCAAAGCCGATGATATCGGCGCTGAAGCTCTCGGCAGAATGCTGACCGTCTACCCTCA
GACCAAGACCTACTTCGCTCACTGGGATGACCTGAGCCCTGGGTCCGGTCCTGTGAAGAA
GCATGGCAAGGTTATCATGGGTGCAGTGGCCGATGCCGTTTCAAAAATAGACGACCTTGT
GGGAGGTCTGGCCTCCCTGAGCGAACTTCATGCTTCCAAGCTGCGTGTTGACCCGGCCAA
CTTCAAGATCCTCGCACACAATGTCATCGTGGTCATCGGCATGCTCTTCCCTGGAGACTT
CCCCCCAGAGGTTCACATGTCAGTTGACAAGTTTTTCCAGAAC---TTGGCTCTGGCTCT
CTCTGAGAAGTACCGCTAA

通過(guò)在序列中插入-來(lái)使得序列對(duì)齊。如果不習(xí)慣命令行的操作方式,也有在線服務(wù)可以使用。EBI提供的在線服務(wù)網(wǎng)址如下

https://www.ebi.ac.uk/Tools/msa/clustalo/

怎樣使用Clustal進(jìn)行多序列比對(duì)

使用非常簡(jiǎn)單,輸入序列,調(diào)整參數(shù)設(shè)置,然后提交即可。在輸出結(jié)果中,還提供了顏色標(biāo)記,進(jìn)化樹可視化等功能。

怎樣使用Clustal進(jìn)行多序列比對(duì)

通過(guò)Mview可視化多序列比對(duì)結(jié)果,示意如下

怎樣使用Clustal進(jìn)行多序列比對(duì)

也支持導(dǎo)出到Jalview軟件中進(jìn)行可視化。

通過(guò)Phylogenetic Tree可以查看進(jìn)化樹的結(jié)果,默認(rèn)采用NJ法建樹,示意如下

怎樣使用Clustal進(jìn)行多序列比對(duì)

也可以通過(guò)Send to Simple Phylogeny, 創(chuàng)建進(jìn)化樹,支持NJ和UPGMA兩種建樹方式。

看完上述內(nèi)容,你們掌握怎樣使用Clustal進(jìn)行多序列比對(duì)的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI