<fieldset id="8116f"></fieldset>

<tt id="8116f"></tt>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

如何利用CODEML中的Site Models進(jìn)行正選擇基因分析

發(fā)布時(shí)間：2022-02-23 10:38:59 來(lái)源：億速云閱讀：356 作者：小新欄目：開(kāi)發(fā)技術(shù)

小編給大家分享一下如何利用CODEML中的Site Models進(jìn)行正選擇基因分析，希望大家閱讀完這篇文章之后都有所收獲，下面讓我們一起去探討吧！

Site Models 簡(jiǎn)介

Site Models是PAML軟件CODEML程序的一個(gè)正選擇作用分析模型，其主要觀點(diǎn)是同一序列不同位點(diǎn)的ω值不同，其中ω = dN/dS，表示非同義/同義替換率。ω比率用于度量正選擇作用。簡(jiǎn)而言之，ω值 < 1，= 1，> 1表示負(fù)的純凈選擇，中性進(jìn)化和正選擇。然而所有位點(diǎn)的平均ω比率和所有的種系幾乎從不 > 1，因?yàn)檎x擇不可能在漫長(zhǎng)的時(shí)間中作用于所有的位點(diǎn)。因此，真正要探究的只是一些種系和一些位點(diǎn)所受的正選擇影響。

在進(jìn)行Site Models分析時(shí)，需要設(shè)置control file中的Model=0。Site Models中有多個(gè)不同的模型，可由Nssites參數(shù)指定，根據(jù)不同Model的選擇設(shè)置不同的值。值得注意的是，以此可以選擇多個(gè)Site Models。如Nssites=0 1 2 3 7 8。

不同的Site Models 表示什么意思？

M0即one-ratio Model，值得是所有位點(diǎn)的ω值是恒定的；
M1表示加假定有一部分位點(diǎn)的ω值為0，其他位點(diǎn)的ω值為1；
M2是在M1的基礎(chǔ)上增加了第三類ω值，該類ω是通過(guò)數(shù)據(jù)計(jì)算得到的，有可能大于1；
M3假定所有位點(diǎn)的ω值呈簡(jiǎn)單的離散分布趨勢(shì)；
M7假定所有位點(diǎn)的ω屬于矩陣（0,1）且呈beta分布；
M8是在M7的基礎(chǔ)上增加另一類ω值，該值可通過(guò)計(jì)算得到，可以大于1；

不同Model的比較可以得到什么樣的結(jié)果？

在Site Models 中，M0表示one ratio for all sites， M3表示所有位點(diǎn)的ω值呈簡(jiǎn)單的離散分布。對(duì)于這兩個(gè)模型的比較并非用于正選擇作用的檢測(cè)，而是用于位點(diǎn)間ω值是否一致的檢測(cè)。

M1 and M2 以及M7 and M8是用于正選擇作用的檢測(cè)，作者推薦使用這兩組比較進(jìn)行LRT檢驗(yàn)來(lái)驗(yàn)證正選擇。不過(guò)Prof.Yang認(rèn)為，The M1-M2 comparison 與 the M7- M8 comparison相比，更加的穩(wěn)定。M7和M8倆模型計(jì)算時(shí)間會(huì)長(zhǎng)一些，如果要進(jìn)行分析的基因較多，可以考慮不比較 M7- M8。

如何檢測(cè)positive sites？

CODEML computation:主要是對(duì)control file中的命令值進(jìn)行設(shè)定之后，運(yùn)行CODEML程序。運(yùn)行CODEML程序需要三個(gè)文件，分別是序列文件（PHYLIP格式），樹(shù)文件和控制文件。控制文件示例：

      seqfile = Fungi.fasta    * sequence data file name
     treefile = Fungi.tree   * tree structure file name

      outfile = mlc          * main result file name
        noisy = 3   * 0,1,2,3,9: how much rubbish on the screen
      verbose = 0   * 1: detailed output, 0: concise output
      runmode = 0   * 0: user tree;  1: semi-automatic;  2: automatic
                    * 3: StepwiseAddition; (4,5):PerturbationNNI; -2: pairwise

      seqtype = 1   * 1:codons; 2:AAs; 3:codons-->AAs
    CodonFreq = 2   * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table
        clock = 0   * 0: no clock, unrooted tree, 1: clock, rooted tree
       aaDist = 0   * 0:equal, +:geometric; -:linear, {1-5:G1974,Miyata,c,p,v}
        model = 0

      NSsites = 0 3 1 2 7 8
                    * 0:one w; 1:NearlyNeutral; 2:PositiveSelection; 3:discrete;
                    * 4:freqs; 5:gamma;6:2gamma;7:beta;8:beta&w;9:beta&gamma;10:3normal
        icode = 0   * 0:standard genetic code; 1:mammalian mt; 2-10:see below
        Mgene = 0   * 0:rates, 1:separate; 2:pi, 3:kappa, 4:all

    fix_kappa = 0   * 1: kappa fixed, 0: kappa to be estimated
        kappa = .3   * initial or fixed kappa
    fix_omega = 0   * 1: omega or omega_1 fixed, 0: estimate
        omega = 1.3  * initial or fixed omega, for codons or codon-based AAs
        ncatG = 10   * # of categories in the dG or AdG models of rates

        getSE = 0   * 0: don't want them, 1: want S.E.s of estimates
 RateAncestor = 0   * (0,1,2): rates (alpha>0) or ancestral states (1 or 2)

   Small_Diff = .45e-6
    cleandata = 1  * remove sites with ambiguity data (1:yes, 0:no)?
  fix_blength = 0  * 0: ignore, -1: random, 1: initial, 2: fixed, 3: proportional

Likelihood ratio test: 即對(duì)兩個(gè)模型進(jìn)行顯著性水平比較，可以使用PAML軟件自帶Chi2子程序進(jìn)行計(jì)算。先計(jì)算兩個(gè)對(duì)應(yīng)模型 Ln L 差值，并取絕對(duì)值后的數(shù)值乘以2，即2△Ln L =|Ln L 1-Ln L2|。利用Chi2程序計(jì)算P值，命令為：Chi2 2 2.03（2為自由度df，site models中df通常使用2；2.03為2△Ln L）。

輸出值 prob <0.05視為顯著，可認(rèn)為該基因受到正選擇。

PP value computation：主要是指位點(diǎn)后驗(yàn)概率的計(jì)算，該結(jié)果是顯示在主輸出文件 mlc中。標(biāo) "*" 號(hào)的位點(diǎn)為顯著的正選擇位點(diǎn)。CODEML程序中常見(jiàn)的計(jì)算后驗(yàn)概率的方法有BEB和NEB。與BEB相比，NEB在計(jì)算的過(guò)程中往往會(huì)忽略抽樣誤差。因此，Prof.Yang建議在讀取運(yùn)算結(jié)果時(shí)，可以直接將NEB result忽略，但值得注意的是，BEB只能在M2a和M8 model下運(yùn)行。

看完了這篇文章，相信你對(duì)“如何利用CODEML中的Site Models進(jìn)行正選擇基因分析”有了一定的了解，如果想了解更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道，感謝各位的閱讀！

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
NCBI如何批量下載數(shù)據(jù)
下一篇新聞：
怎么使用Python畫圖紀(jì)念黃家駒

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<menu id="a161i"></menu>