您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關(guān)QUAST有什么用的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
對于不同kmer或者不同軟件的基因組組裝結(jié)果,我們通常會通過N50等指標(biāo)來進行評估。
對于一個組裝出來的序列,不論是contig還是scaffold, 首先將各個序列根據(jù)長度從大到小排序,然后從第一個序列開始,將長度進行累加,直到累加的長度超過了總長度的50%,此時,最后一個累加的contig的長度就是N50的長度。示意圖如下
上圖中N50的長度就是60,和N50的概念類似,還有N75, N90等說法,這些指標(biāo)可以統(tǒng)稱為Nx。Nx越大,說明組裝出來的片段長度越長一定程度上,證實了組裝結(jié)果越好。
除了Nx指標(biāo)外,還有Lx指標(biāo),比如L50,指的是累加的contig的個數(shù),示意圖如下
上圖中L50的值是3。在實際分析中,我們可以通過現(xiàn)有軟件來計算N50, L50等指標(biāo),quast就是最常用的軟件之一。該軟件有在線服務(wù),鏈接如下
http://quast.bioinf.spbau.ru/
只需要上傳fasta格式的contig或者scaffold序列,然后提交即可。在線服務(wù)雖然方便,但是也是有限制的,上傳的fasta文件大小不能夠超過100Mb,對于實際的基因組項目而言,當(dāng)是不能滿足要求。此時,可以下載軟件到本地服務(wù)器,然后運行。
安裝過程如下
wget https://sourceforge.net/projects/quast/files/quast-4.6.3.tar.gz tar xzvf quast-4.6.3.tar.gz cd quast-4.6.3/
quast基于python開發(fā),以來matplotlib庫進行繪圖,保證python和matplotlib安裝好,然后直接下載源代碼,解壓縮就可以使用了。
用法如下
python quast.py -t 10 -o test1_out contigs.fasta
-t
參數(shù)指定線程數(shù),-o
參數(shù)指定輸出結(jié)果的目錄。運行完成后,輸出目錄會生成如下文件
├── basic_stats ├── icarus.html ├── icarus_viewers ├── quast.log ├── report.html ├── report.tex ├── report.tsv ├── report.txt ├── transposed_report.tex ├── transposed_report.tsv └── transposed_report.txt
直接看report.html文件就就可以了。
quast 會統(tǒng)計不同長度的contig的個數(shù),以及N50,L50等指標(biāo),示例結(jié)果如下
橫坐標(biāo)為Nx,縱坐標(biāo)為Nx的值,示意圖如下
橫坐標(biāo)為contig個數(shù),縱坐標(biāo)為累加的長度,示意圖如下
窗口的GC含量分布圖,quast將每個contig劃分為長度100bp的窗口,統(tǒng)計每個窗口的GC含量, 橫坐標(biāo)為GC含量,縱坐標(biāo)為窗口個數(shù), 示意圖如下
contig GC含量分布圖,對于每個contig,統(tǒng)計GC含量,橫坐標(biāo)為GC含量,縱坐標(biāo)為contig個數(shù),示意圖如下
感謝各位的閱讀!關(guān)于“QUAST有什么用”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。