怎么理解GWAS中的genotype imputation

發(fā)布時間：2021-11-22 17:46:10 來源：億速云閱讀：273 作者：柒染欄目：大數(shù)據(jù)

怎么理解GWAS中的genotype imputation，針對這個問題，這篇文章詳細介紹了相對應(yīng)的分析和解答，希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

GWAS用于尋找與疾病或者特定性狀相關(guān)聯(lián)的SNP位點，為了更加有效的挖掘信息，GWAS需要大樣本量和高密度的SNP分型結(jié)果，最佳的分型方案當然是全基因組測序，然而成百上千個樣本的全基因組測序其成本依然是巨大的，目前更加經(jīng)濟有效的方案是GWAS芯片，針對特定人群，利用tag SNP的思想設(shè)計探針，覆蓋的SNP位點在幾十M的數(shù)量級。

相比全基因組測序，GWAS芯片確實更加經(jīng)濟，但是其缺點也是顯而易見的，只能夠分析挖掘已知的SNP位點，而且位點數(shù)據(jù)量相對較少，要知道一個全基因組測序分析得到的SNP位點在幾百M左右。為了解決這個問題，科學家提出了基因型填充的思想。

genotype imputation，稱之為基因型填充，基本思想是利用單倍型來推斷芯片未覆蓋到的SNP位點的分型結(jié)果，在家系數(shù)據(jù)和獨立樣本的分析中都適用。家系樣本基因型填充的過程示意如下

怎么理解GWAS中的genotype imputation

部分樣本具有較為完整的SNP分型結(jié)果，依據(jù)這些樣本的分型結(jié)果構(gòu)建在家系樣本中共享的單倍型，對應(yīng)圖中方框標記的完整分型結(jié)果，針對基因型缺失的樣本，根據(jù)親緣關(guān)系推斷該樣本可能的單倍型，對于基因型缺失的位點，直接使用對應(yīng)單倍型中的分型結(jié)果進行填充。

獨立樣本的基因型填充過程示意如下

怎么理解GWAS中的genotype imputation

首先需要有一個參照的單倍型，根據(jù)樣本已有的分型結(jié)果，與參照的單倍型進行比較，確定其可能所屬的單倍型，然后進行填充。

以上示意圖來自下列文獻

Genotype Imputation
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2925172/

從以上示意圖可以看出，基因型填充有兩個必要條件，第一個條件就是參照的單倍型，對于獨立樣本，可以采用hapmap或者1000G等項目的單倍型作為參照，第二個條件就是已知分型結(jié)果位點的比例和分布，對于需要填充的樣本，要保證一定密度的分型結(jié)果，需要根據(jù)已有的分型結(jié)果來推斷該樣本可能的單倍型，分型結(jié)果已知的位點越多，其單倍型推斷的準確性越高，填充的準確性才會越高，根據(jù)這個條件來看，GWAS芯片最適合進行基因型填充，因為其覆蓋的SNP位點的數(shù)量和分布更有助于推測樣本的單倍型。

目前已經(jīng)有很多用于基因型填充的軟件，部分列表如下

Beagle
IMPUTE2
MACH

關(guān)于怎么理解GWAS中的genotype imputation問題的解答就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識。

向AI問一下細節(jié)

怎么理解GWAS中的genotype imputation

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽