溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何使用plink進(jìn)行連鎖不平衡分析

發(fā)布時(shí)間:2021-11-10 17:02:29 來源:億速云 閱讀:975 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了如何使用plink進(jìn)行連鎖不平衡分析,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。

plink是進(jìn)行連鎖不平衡分析的常用工具之一,需要兩個(gè)基本的輸入文件,后綴分別為ped和map。ped文件格式在之前的文章中已經(jīng)詳細(xì)介紹過,這里只介紹map文件。

map文件主要保存SNP位點(diǎn)的名稱和位置信息,內(nèi)容如下

1 snp1 0 1
1 snp2 0 2

共4列,每一行代表一個(gè)SNP位點(diǎn),第一列代表SNP位點(diǎn)所在染色體的名字,第二列代表SNP位點(diǎn)的ID,通常是rs編號,也可以是自定義的ID;第三列代表SNP位點(diǎn)的遺傳距離,如果沒有實(shí)際數(shù)值可以用0填充;第四列代表SNP位點(diǎn)在染色體上的位置。

plink 進(jìn)行LD分析有以下兩種方式:

1. 分析指定的兩個(gè)SNP位點(diǎn)

命令如下

plink --file test  --ld snp1 snp2

在log信息中,會(huì)輸出LD分析的結(jié)果

LD information for SNP pair [ snp1 snp2 ]
   R-sq = 0.009     D' = 0.163
   Haplotype     Frequency    Expectation under LE
   ---------     ---------    --------------------
       AG          0.116            0.139
       CG          0.300            0.278
       AT          0.217            0.194
       CT          0.366            0.389
   In phase alleles are AT/CG
Analysis finished: Sat Jun 23 11:48:35 2018

給出了R2和D’ 兩個(gè)值,同時(shí)還給出了不同單倍型的頻率。

2. 對所有的SNP位點(diǎn)進(jìn)行分析

命令如下:

plink --file test   --r
plink --file test   --r2

--r會(huì)直接輸出所有LD分析的結(jié)果,而--r2會(huì)根據(jù)R2值對結(jié)果進(jìn)行過濾。在實(shí)際分析中,SNP位點(diǎn)個(gè)數(shù)是非常多的,如果不進(jìn)行過濾,結(jié)果文件會(huì)非常的大。過濾的參數(shù)有以下幾種

  1. --ld-window
    默認(rèn)值為10,這個(gè)參數(shù)限定了一個(gè)SNP位點(diǎn)最多和10個(gè)其他的SNP位點(diǎn)進(jìn)行LD分析。

  2. --ld-window-kb
    默認(rèn)值為1Mb, 只對距離在1Mb之內(nèi)的SNP位點(diǎn)進(jìn)行分析。

  3. --ld-window-r2
    這個(gè)參數(shù)只能和--r2參數(shù)搭配使用,默認(rèn)值為0.2, 對輸出結(jié)果進(jìn)行過濾,只輸出R2大于該參數(shù)值的LD分析結(jié)果。

輸出文件為plink.ld。這個(gè)文件給出了SNP位點(diǎn)間的R值或者R2值,示例如下

CHR_A BP_A SNP_A CHR_B BP_B SNP_B  R
  1         1       snp1      1         2     snp2    -0.108465

通過指定--ld-snp參數(shù),也可以只分析某個(gè)SNP位點(diǎn)與其他位點(diǎn)的連鎖關(guān)系,用法如下

plink  --file test  --r2 --ld-snp snp1 --ld-window-kb 1000 --ld-window 99999 --ld-window-r2 0

以上兩種方法更有優(yōu)劣,第一種方法會(huì)給出D’和R2兩個(gè)值,第二種方法只會(huì)給出R值;第一種方法一次只能分析兩個(gè)SNP位點(diǎn)間的連鎖關(guān)系,而第二種方法一次可以分析多個(gè)SNP位點(diǎn)間的連鎖關(guān)系。

上述內(nèi)容就是如何使用plink進(jìn)行連鎖不平衡分析,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI