溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何使用Minimac進行基因型填充

發(fā)布時間:2021-07-12 17:25:56 來源:億速云 閱讀:649 作者:chen 欄目:大數(shù)據(jù)

這篇文章主要講解了“如何使用Minimac進行基因型填充”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“如何使用Minimac進行基因型填充”吧!

源代碼保存在github上,網(wǎng)址如下

https://github.com/statgen/Minimac4

為了減少內(nèi)存消耗,和beagle軟件類似,minimac提出了一種名為M3VCF的格式,用來存儲referenc panel的單倍型信息,將單倍型劃分為不同的block, 示意如下

如何使用Minimac進行基因型填充

上圖表示的是9個SNP位點構(gòu)成的8種單倍型,minimac會根據(jù)染色體位置劃分成不同的block區(qū)間,識別block區(qū)間內(nèi)的unique haplotypes。兩個鄰近的block區(qū)域必須有一個重疊的位點,圖中的9個位點劃分成了兩個block, 1-6號位點對應(yīng)block B, 6到9號位點對應(yīng)block B+1。在block B中,有3種唯一的單倍型,對應(yīng)三種不同顏色。

M3VCF的內(nèi)容示意如下

如何使用Minimac進行基因型填充

和VCF格式類似,在每個blcok的開頭會有一行用于顯示block的信息,包含的變異位點數(shù)VARIANTS,unique haplotype的個數(shù)REPS等,詳細的介紹請參考以下鏈接

https://genome.sph.umich.edu/wiki/M3VCF_Files

相比VCF格式,該格式磁盤占用小,讀取速度更快,內(nèi)存消耗小。官網(wǎng)提供了1000G的reference panel供下載,鏈接如下

https://genome.sph.umich.edu/wiki/Minimac4#Reference_Panels_for_Download

如何使用Minimac進行基因型填充

該軟件推薦的基因型填充pipeline步驟如下

  1. study樣本分型結(jié)果的質(zhì)量控制,參考GWAS的質(zhì)控條件

  2. 對質(zhì)控后的分型結(jié)果進行pre-phasing, 支持MACH和shapeit兩個軟件的結(jié)果

  3. 將pre-phasing的結(jié)果轉(zhuǎn)化成VCF格式

  4. 選擇reference panel,推薦1000G或者HRC

  5. 進行填充

實際操作中典型的用法如下

1. pre-phasing

以MACH為例,用法如下

mach2 \
-d Gwas.chr20.Unphased.dat \
-p Gwas.chr20.Unphased.ped \
--rounds 20 \
--states 200 \
--phase \
--interim 5 \
--sample 5 \
--prefix Gwas.Chr20.Phased.Output

MACH要求輸入的分型結(jié)果格式為dat和ped格式,詳細的解釋參見以下鏈接

http://csg.sph.umich.edu/abecasis/Merlin/tour/input_files.html

2. convert to vcf

通過MACH2VCF進行格式轉(zhuǎn)換,用法如下

mach3VCF \
--haps Gwas.Chr20.Phased.Output.hap \
--snps Gwas.Chr20.Phased.Output.snps \
--prefix Gwas.Chr20.Phased.Output.VCF.Format

該腳本可以從以下鏈接下載

ftp://share.sph.umich.edu/minimac3/Mach3VCF.v1.Source.Binary.tar.gz

3. impute

采用minimac4進行填充,用法如下

minimac4 \
--refHaps refPanel.m3vcf \
--haps Gwas.Chr20.Phased.Output.VCF.Format.vcf \
--prefix testRun \
--cpus 5

minimac4會自動將染色體拆分成不同的區(qū)間,在結(jié)合多線程,可以大大提高運行速度。

感謝各位的閱讀,以上就是“如何使用Minimac進行基因型填充”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對如何使用Minimac進行基因型填充這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI