您好,登錄后才能下訂單哦!
小編給大家分享一下motif中PFM矩陣是怎么樣的,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
PFM全稱為position frequency matrix, 用于代表motif的堿基分布頻數(shù),本身是一個(gè)很容易了解的概念,以下圖所示的motif序列為例
根據(jù)以上8條序列可以統(tǒng)計(jì)出對(duì)應(yīng)的堿基分布頻數(shù),如下所示
每行為一種堿基,每一列為motif的一個(gè)位置。
在描述motif信息時(shí),除了一致性序列和sequence logo外,PFM矩陣也是一個(gè)常見的元素。不同軟件會(huì)有不同的標(biāo)準(zhǔn),理解這些格式就是本文的核心內(nèi)容。
JASPAR是一個(gè)常用的轉(zhuǎn)錄因子motif數(shù)據(jù)庫(kù),在該數(shù)據(jù)庫(kù)中,針對(duì)PFM矩陣有多種格式,如下圖所示
原始的PFM矩陣示意如下
第一行和fasta格式的序列標(biāo)識(shí)符類似,>
開頭,MA
開頭的字符串為轉(zhuǎn)錄因子在JASPAR數(shù)據(jù)庫(kù)中的編號(hào),是唯一的,AGL3
表示該轉(zhuǎn)錄因子的名稱。
接下來的4行依次表示A
, C
, G
, T
4種堿基在每個(gè)位置的頻數(shù)分布。
JASPAR格式的PFM矩陣示意如下
和原始的PFM矩陣非常類似,只不過在每行的開頭標(biāo)注了對(duì)應(yīng)的堿基,并且用[
和]
操作符將堿基頻數(shù)矩陣?yán)ㄆ饋怼?/p>
TRANSFAC格式的PFM矩陣示意如下
采用了TRANSFAC數(shù)據(jù)庫(kù)中的文件標(biāo)準(zhǔn),AC
表示motif編號(hào),ID
表示motif的名稱,PO
以及下面的行為對(duì)應(yīng)的堿基分布頻數(shù)。
MEME格式的PFM矩陣示意如下
ALPJABEAT
代表堿基的字符集,strands
代表鏈的方向性,+ -
代筆在使用meme預(yù)測(cè)motif時(shí)沒有指定鏈的方向,Background
代表背景中的堿基組成頻率,MOTIF
和以下的行為對(duì)應(yīng)的堿基分布頻率。
不同的軟件和數(shù)據(jù)庫(kù)對(duì)應(yīng)的PFM矩陣的格式不同,在使用不同軟件和數(shù)據(jù)庫(kù)時(shí)需要注意。
看完了這篇文章,相信你對(duì)“motif中PFM矩陣是怎么樣的”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。