您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“大數(shù)據(jù)中如何繪制曼哈頓圖”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“大數(shù)據(jù)中如何繪制曼哈頓圖”這篇文章吧。
曼哈頓圖的命名得益于其形狀,和紐約市曼哈頓區(qū)鱗次櫛比的大樓非常相近,曼哈頓區(qū)是摩天大樓最多的城市,標(biāo)志性的景觀如下
曼哈頓圖示意如下
每條染色體可以看做是一座高樓,整體看上去形似曼哈頓區(qū)的摩天大樓,所以稱之為曼哈頓圖。
了解了曼哈頓圖的命名,再來看下它所展示的信息。從上圖可以看出,曼哈頓圖的x軸為snp位點(diǎn)在染色體上的位置,y軸為SNP位點(diǎn)對應(yīng)的p值。從本質(zhì)上來看,屬于散點(diǎn)圖。有x軸和y軸的坐標(biāo),人人都可以畫散點(diǎn)圖,那為何曼哈頓圖的繪制看上去并非如此簡單呢?
秘密就在于SNP位點(diǎn)的染色體位置,對于不同的染色體,在標(biāo)記位置時都是從1開始計(jì)數(shù)的,比如1號和2號染色體的12bp對應(yīng)的是兩個snp位點(diǎn)。通過染色體和位置兩列信息相結(jié)合, 可以唯一表征snp位點(diǎn)的位置。
然而在繪制散點(diǎn)圖時,x軸只能用1個數(shù)值來表示。在曼哈頓圖中,將染色體線性排列,1號染色體的位置不變,2號染色體的位置在原來的基礎(chǔ)上再加上的1號染色體的總長度,然后依次類推,通過這樣一種形式,將原始輸入文件中染色體和位置兩列信息,轉(zhuǎn)換為繪圖所用的x軸坐標(biāo)信息。
在實(shí)際分析中,通過qqman
這個R包可以來實(shí)現(xiàn)曼哈頓圖的繪制,用法如下
輸出結(jié)果如下所示
可以看到,只需要準(zhǔn)備好同樣格式的輸入文件,繪制曼哈頓圖就是幾秒鐘的事情。曼哈頓圖展示了每個SNP位點(diǎn)的p值信息,圖中的兩個水平橫線對應(yīng)篩選顯著位點(diǎn)的閾值,一個對應(yīng)的p值是1e-5,另一個對應(yīng)的p值是5e-8。
當(dāng)然該R包還提供了很多的功能,比如高亮標(biāo)記指定的snp位點(diǎn)等,改變?nèi)旧w顯示的名稱等等,能夠滿足基本需求,但是還是由許多限制,比如不能展示性染色體。該包的源代碼中會自動對數(shù)據(jù)過濾,只保留常染色體上的SNP位點(diǎn)。
使用別人的R包就是這個樣子,別人給你什么,你用什么,想要個性化,要么通知R包的開發(fā)者新增功能,當(dāng)然人家不一定會買賬,要么自己來。
將qqman中的核心源代碼部分截取出來,如下
這里省略了顏色的賦值,可以看到,大部分的工作是在計(jì)算snp位點(diǎn)對應(yīng)的x軸坐標(biāo),畫圖的代碼只有寥寥幾句。
理解了曼哈頓圖的本質(zhì),就可以自已用R或者熟悉的軟件來定制曼哈頓圖。
以上是“大數(shù)據(jù)中如何繪制曼哈頓圖”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。