溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

motif中PWM矩陣的示例分析

發(fā)布時(shí)間:2021-12-27 10:41:50 來源:億速云 閱讀:174 作者:小新 欄目:大數(shù)據(jù)

小編給大家分享一下motif中PWM矩陣的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

通過一致性序列和sequence logo可以直觀的表示某個(gè)motif的情況,但是在預(yù)測motif結(jié)合的位點(diǎn)時(shí),只根據(jù)這些信息無法準(zhǔn)確的判斷查詢序列上存在對應(yīng)的motif。 預(yù)測輸入序列上是否存在特定motif的位點(diǎn)的分析,稱之為motif scanning, 示意如下

motif中PWM矩陣的示例分析

就是在輸入序列上查找特定motif出現(xiàn)的位置。為了滿足motif scanning分析的要求,對于motif而言,我們必須提供一個(gè)有效的能夠代表motif又能夠用于序列查找的一個(gè)信息,基于這樣的出發(fā)點(diǎn),提出了PWM矩陣的概念。

PWM矩陣在不同文章中有不同的叫法,以下3種矩陣其實(shí)都是PWM矩陣

  1. position weight matrix(PWM)

  2. position-specific weight matirx(PSWM)

  3. position-specific scoring matrix(PSSM)


PWM矩陣是在PFM矩陣的基礎(chǔ)上發(fā)展而來,以下圖所示PFM矩陣為例

motif中PWM矩陣的示例分析

根據(jù)堿基頻數(shù)分布矩陣首先計(jì)算出堿基頻率分布矩陣,稱之為position probability matrixa, 簡寫為PPM矩陣,示意如下

motif中PWM矩陣的示例分析

在PPM矩陣中,堿基的頻率被當(dāng)做概率來使用,不同位置之間可以看做是一個(gè)獨(dú)立事件。根據(jù)PPM矩陣,可以計(jì)算某個(gè)motif序列的概率。根據(jù)上述PPM矩陣,GAGGTAAAC出現(xiàn)的概率為

motif中PWM矩陣的示例分析

在PPM矩陣基礎(chǔ)上,用背景序列的堿基分布頻率來校正對應(yīng)的值,就可以得到PWM矩陣,公式如下

motif中PWM矩陣的示例分析
就是將PPM矩陣中對應(yīng)的值除了背景序列中對應(yīng)堿基的頻率,然后在取log2對數(shù)值。大多數(shù)情況下,我們認(rèn)為在基因組上A,T,C,G這4種堿基的含量是相等的,所以每個(gè)堿基的背景頻率就是0.25。以PPM矩陣第一行的0.3為例,首先將0.3除以背景序列中A堿基的頻率0.25,然后在取log2對數(shù),最終的取值越為0.26。

通過這種方式就構(gòu)建出了如下所示的PWM矩陣

motif中PWM矩陣的示例分析

需要注意的是,背景序列中堿基的概率不是都為0.25, 在某些GC含量偏高或者偏低的物種中,4種堿基的分布頻率是不相等的,此時(shí)就要根據(jù)真實(shí)的堿基分布來確定背景序列中的堿基頻率。

根據(jù)PWM矩陣,可以對序列進(jìn)行打分,以最終的得分值來判斷是否為一個(gè)潛在的motif。根據(jù)上述PWM矩陣,GAGGTAAAC出現(xiàn)的得分值為

motif中PWM矩陣的示例分析

score >= 0, 說明這個(gè)序列是一個(gè)潛在的功能位點(diǎn),score < 0, 說明是一個(gè)隨機(jī)序列。根據(jù)PWM矩陣,可以有效的判斷在輸入序列中是否存在真實(shí)的motif位點(diǎn)。


看完了這篇文章,相信你對“motif中PWM矩陣的示例分析”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI