您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關如何進行一鍵批量計算ka和ks,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
ParaAT安裝
1. 下載ParaAT2.0
(https://bigd.big.ac.cn/tools/paraat)
解壓后,“ParaAT.pl”是運行的腳本??梢园呀鈮汉蟮穆窂郊尤氕h(huán)境變量,或者用腳本所在的絕對路徑來運行也可以。
2. 安裝所需的依賴工具,依賴工具需要加入環(huán)境變量
蛋白比對工具,推薦安裝muscle,比對效果相對最好,比對速度快,但
KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)
準備輸入文件
1. 同源基因列表,文件格式如下:
geneA1 geneA2 geneA3geneB1 geneB2 geneB3geneC1 geneC2 geneC3geneD1 geneD2 geneD3
每一行表示一組同源基因,每一列表示每個物種對應的基因。gene ID之間用tab符隔開。
2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要與同源基因列表文件中的ID一致;
3. 多線程運行,指定線程數(shù)量的文件。
這個文件只需要寫入一個數(shù)字即可,表示有多少個線程同時運行。
三種示例文件可以在解壓的安裝包中找到,分別是:test.homologs, test.pep, test.cds, proc
運行ParaAT
運行代碼如下:
ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -g -k -o result_dir
-h, 指定同源基因列表文件
-n, 指定核酸序列文件
-a, 指定蛋白序列文件
-p, 指定多線程文件
-m, 指定比對工具
-g, 去除比對有gap的密碼子
-k, 用KaKs_Calculator 計算kaks值
-o, 輸出結(jié)果的目錄
注:
1. 如果需要用PAML,Hyphy等工具分析kaks時,ParaAT也可以生成這些工具所需的輸入文件(-f 參數(shù))
2. 如果是細菌的序列,需要設置成細菌對應的Genetic Code used (-c 11)。其他物種同理,默認的是The Standard Code (-c 1)
看完上述內(nèi)容,你們對如何進行一鍵批量計算ka和ks有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注億速云行業(yè)資訊頻道,感謝大家的支持。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。