您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“如何使用CD-HIT合并pacbio轉(zhuǎn)錄本”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“如何使用CD-HIT合并pacbio轉(zhuǎn)錄本”這篇文章吧。
CD-HIT合并pacbio轉(zhuǎn)錄本
Pacbio三代全長(zhǎng)轉(zhuǎn)錄組采用isoseq3 進(jìn)行了轉(zhuǎn)錄本的篩選,聚類和校正之后得到高質(zhì)量的轉(zhuǎn)錄本序列,可以對(duì)序列再進(jìn)行一定的合并操作。
采用cDNA_Cupcaake 文檔中提供的cd-hit方案,運(yùn)行命令如下:
cd-hit-est -i <input> -o <output> -c 0.99 -T 6 -G 0 -aL 0.90 -AL 100 -aS 0.99 -AS 30
參數(shù)說明:
input: 是pacbio 的isoseq 3 輸出的高質(zhì)量轉(zhuǎn)錄本序列文件
output: 輸出的合并序列文件
-c : 序列相似性,99%的相似性
-T : 線程數(shù),6個(gè)線程
-G: 采用的比對(duì)策略,默認(rèn)是1,采用全局比對(duì)。這地方設(shè)置為0,將采用局部比對(duì)策略。
-aL: 長(zhǎng)序列的覆蓋度,設(shè)置為90%
-AL: 長(zhǎng)序列覆蓋區(qū)域的長(zhǎng)度,設(shè)置為最小100bp
-aS: 短序列的覆蓋度,設(shè)置為99%
-AS: 短序列覆蓋區(qū)域的最小長(zhǎng)度,設(shè)置為30bp
以上是“如何使用CD-HIT合并pacbio轉(zhuǎn)錄本”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。