溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件

發(fā)布時(shí)間:2021-11-18 10:19:39 來(lái)源:億速云 閱讀:1189 作者:小新 欄目:大數(shù)據(jù)

這篇文章主要介紹R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!


使用R語(yǔ)言的 ggbio 這個(gè)包可視化gff3格式的基因組注釋文件

我用到的文件是NCBI下載的擬南芥注釋文件,為了減小計(jì)算壓力,我只用到了gff文件的前119行,兩個(gè)基因。

 首先是讀入gff文件

用到的函數(shù)是 GenomicFeatures R包中的 **makeTxDbFromGFF()**函數(shù)

library(GenomicFeatures)
txdb<-makeTxDbFromGFF(file="practice.gff",format="gff3")
   可視化

用到的 ggbio 這個(gè)包中的 **autoplot()**這個(gè)函數(shù)

library(ggbio)
autoplot(txdb,
        which=GRanges("CP002684.1", IRanges(100, 9000)),
        names.expr = "gene_id")+
 theme_bw()
 

結(jié)果R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件

可以通過(guò)fill參數(shù)設(shè)置不同的顏色

autoplot(txdb,
        which=GRanges("CP002684.1", IRanges(100, 9000)),
        names.expr = "gene_id",fill="red")+
 theme_bw()
 
R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件  
image.png

不同的基因填充不同的顏色

autoplot(txdb,
        which=GRanges("CP002684.1", IRanges(100, 9000)),
        names.expr = "gene_id",aes(fill=gene_id))+
 theme_bw()
 
R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件  
image.png

現(xiàn)在還不知道如何給同一個(gè)基因不同的部分(utr,exon,intron)等填充不同的顏色 還有就是 makeTxDbFromGFF() 函數(shù)讀入的數(shù)據(jù)存儲(chǔ)格式還沒(méi)搞懂

開(kāi)頭提到的參考資料里有一幅圖將 reads數(shù)量, 覆蓋度的折線圖,vcf文件的結(jié)果,gff可視化的結(jié)果畫(huà)到了一起,做基因組重測(cè)序分析應(yīng)該會(huì)用得到。這里暫時(shí)不重復(fù)了。等用到的時(shí)候再說(shuō)。R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件


以上是“R語(yǔ)言如何實(shí)現(xiàn)可視化展示gff3格式基因組注釋文件”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI