溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何進行一鍵批量計算ka和ks

發(fā)布時間:2021-12-10 11:15:43 來源:億速云 閱讀:461 作者:柒染 欄目:大數(shù)據(jù)

今天就跟大家聊聊有關如何進行一鍵批量計算ka和ks,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。


ParaAT安裝


    1. 下載ParaAT2.0

    (https://bigd.big.ac.cn/tools/paraat)

解壓后,“ParaAT.pl”是運行的腳本??梢园呀鈮汉蟮穆窂郊尤氕h(huán)境變量,或者用腳本所在的絕對路徑來運行也可以。

    2. 安裝所需的依賴工具,依賴工具需要加入環(huán)境變量

  • 蛋白比對工具,推薦安裝muscle,比對效果相對最好,比對速度快,但

它比其它工具更消耗內(nèi)存。
  • KaKs_Calculator (http://bigd.big.ac.cn/tools/kaks)



準備輸入文件



    1. 同源基因列表,文件格式如下:

geneA1  geneA2  geneA3geneB1  geneB2  geneB3geneC1  geneC2  geneC3geneD1  geneD2  geneD3

每一行表示一組同源基因,每一列表示每個物種對應的基因。gene ID之間用tab符隔開。

    2. fasta格式的蛋白序列文件和核酸序列文件,注意gene ID要與同源基因列表文件中的ID一致;

    3. 多線程運行,指定線程數(shù)量的文件。

這個文件只需要寫入一個數(shù)字即可,表示有多少個線程同時運行。

三種示例文件可以在解壓的安裝包中找到,分別是:test.homologs, test.pep, test.cds, proc


運行ParaAT

運行代碼如下:

ParaAT.pl -h test.homologs -n test.cds -a test.pep -p proc -m muscle -g -k -o result_dir

-h, 指定同源基因列表文件

-n, 指定核酸序列文件

-a, 指定蛋白序列文件

-p, 指定多線程文件

-m, 指定比對工具

-g, 去除比對有gap的密碼子

-k, 用KaKs_Calculator 計算kaks值

-o, 輸出結(jié)果的目錄

注:

1. 如果需要用PAML,Hyphy等工具分析kaks時,ParaAT也可以生成這些工具所需的輸入文件(-f 參數(shù))

2. 如果是細菌的序列,需要設置成細菌對應的Genetic Code used (-c 11)。其他物種同理,默認的是The Standard Code (-c 1)

看完上述內(nèi)容,你們對如何進行一鍵批量計算ka和ks有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

ka ks
AI