您好,登錄后才能下訂單哦!
怎么使用trim_galore對(duì)NGS數(shù)據(jù)進(jìn)行質(zhì)量過濾,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
cutadapt軟件可以對(duì)NGS數(shù)據(jù)進(jìn)行質(zhì)量過濾,F(xiàn)astQC軟件可以查看NGS數(shù)據(jù)的質(zhì)量分布,trim_galore將這兩個(gè)軟件封裝到一起,使用起來更加的方便。
該軟件會(huì)對(duì)數(shù)據(jù)進(jìn)行以下4步處理
illumina平臺(tái)的測序數(shù)據(jù),通常3’端質(zhì)量較差。trim_galore首先會(huì)過濾掉3’端的低質(zhì)量堿基,本質(zhì)上是調(diào)用了cutadapt的質(zhì)量過濾算法。下圖是過濾前后堿基質(zhì)量的分布圖
可以看到,過濾掉低質(zhì)量堿基后,序列的整體質(zhì)量顯著提高。
過濾掉低質(zhì)量的堿基之后,trim_galore會(huì)調(diào)用cutadapt在reads的3’端查找adapter 序列并去除。通常情況下,我們需要指定對(duì)應(yīng)的adapter序列,如果沒有指定的化,trim_galore會(huì)自動(dòng)查找以下3種類型的adapter
Illumina: AGATCGGAAGAGC Small RNA: TGGAATTCTCGG Nextera: CTGTCTCTTATA
默認(rèn)讀取前一百萬條序列,通過這一百萬條序列判斷adapter屬于上述三種的哪一種,然后進(jìn)行去除。如果你不希望軟件自動(dòng)判斷,也可以通過--illumina
, --nextera
, --small_rna
參數(shù)指定對(duì)應(yīng)的adapter類型。
經(jīng)過上述兩步處理之后,有可能剩余的序列長度很短,這部分短序列也會(huì)被去除。默認(rèn)情況下,如果序列長度少于20bp, 這條序列會(huì)被丟掉。
對(duì)于所有的輸入序列,以上3個(gè)步驟是肯定會(huì)執(zhí)行的。除此之,trim_galore還支持一些其他的過濾措施,以滿足個(gè)性化的需求。
hardtrim5
參數(shù)用于從序列的3’端切除堿基,示意如下
before: CCTAAGGAAACAAGTACACTCCACACATGCATA --hardtrim5 20: CCTAAGGAAACAAGTACACT
通過hardtrim5
參數(shù)可以將序列截取成固定長度。與之對(duì)應(yīng)的,還有一個(gè)hardtrim3
參數(shù),從序列的5’端切除堿基,示意如下
before: CAAATGTTATTTTTAAGAAAATGGAAAAT --hardtrim3 20: TTTTTAAGAAAATGGAAAAT
軟件的安裝也很方便,首先需要確保cutadapt
和fastqc
這兩個(gè)軟件已經(jīng)安裝,并且可執(zhí)行文件位于PAH
環(huán)境變量定義的路徑種。然后下載trim_galore的源代碼包,解壓即可,代碼如下
wget https://github.com/FelixKrueger/TrimGalore/archive/0.5.0.tar.gz tar xzvf 0.5.0.tar.gz
在軟件的安裝目錄有一個(gè)名為trim_galore
的可執(zhí)行文件。
對(duì)于單端測序數(shù)據(jù),基本用法如下
trim_galore --quality 20 -a AGATCGGAAGAGC --length 20 -o out_dir input.fq
對(duì)于雙端測序數(shù)據(jù),基本用法如下
trim_galore --paired --quality 20 -a AGATCGGAAGAGC -a2 AGATCGGAAGAGC --length 20 -o out_dir R1.fq.gz R2.fq.gz
看完上述內(nèi)容,你們掌握怎么使用trim_galore對(duì)NGS數(shù)據(jù)進(jìn)行質(zhì)量過濾的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。