溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

發(fā)布時間:2021-12-08 15:27:56 來源:億速云 閱讀:163 作者:柒染 欄目:大數(shù)據(jù)

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

得益于分析軟件運行速度的不斷提高,硬件資源消耗的不斷優(yōu)化,基因型填充這一計算量巨大的任務(wù)也出現(xiàn)了web服務(wù),Michigan Imputation Server就是其中之一。

采用Eagle進(jìn)行pre-phasing, minimac4進(jìn)行填充的分析策略,保證了運行速度。該平臺支持hg19和hg38兩個基因組版本,支持的reference panel列表如下

  1. HRC (Version r1.1 2016)

  2. 1000 Genomes Phase 1 (Version 3)

  3. 1000 Genomes Phase 3 (Version 5)

  4. CAAPA - African American Panel

  5. HapMap 2


要求輸入文件為VCF格式,可以通過以下方法轉(zhuǎn)換得到

# plink將ped/map轉(zhuǎn)換為vcf格式
plink --file sample --recode vcf --chr 1 --out sample.chr1
# vcftools對VCF文件排序
# bgzip壓縮VCF文件
vcf-sort sample.chr1.vcf | bgzip  -c > sample.chr1.vcf.gz

按照染色體進(jìn)行拆分,每條染色體一個VCF文件,然后通過提交頁面上傳即可,示意如下

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

選擇參考的panel, 上傳VCF格式的輸入文件,設(shè)置參考基因組版本,然后提交即可。運行的步驟如下

1. input validation

按照20M的長度將染色體拆分成chunk, 統(tǒng)計輸入文件的樣本數(shù),染色體條數(shù),位點數(shù),chunk數(shù),reference panel等基本信息,結(jié)果示意如下

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

2. quality control

從snp和sample兩個方面進(jìn)行指控,結(jié)果統(tǒng)計如下

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

3. pre-phasing and imputation

對于每個chunks, 進(jìn)行pre-phasing和imputation

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

運行完成后,合并同一染色體的不同chunks,然后將結(jié)果打包,并加密,輸出結(jié)果示意如下

如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server

該網(wǎng)站內(nèi)置了HRC reference panel這個最大規(guī)模的單倍型數(shù)據(jù)集,在運行速度快的同時也保證了填充的準(zhǔn)確性,盡管其填充準(zhǔn)確率不會像impute2那么高。

上述就是小編為大家分享的如何分析基因型填充的在線工具M(jìn)ichigan Imputation Server了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI