溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

vcftools基本參數(shù)有哪些

發(fā)布時(shí)間:2022-02-25 15:23:15 來源:億速云 閱讀:667 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要為大家展示了“vcftools基本參數(shù)有哪些”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“vcftools基本參數(shù)有哪些”這篇文章吧。

vcftools使用

vcftools是一種可以對(duì)VCF文件和BCF文件進(jìn)行格式轉(zhuǎn)換及過濾的工具,其中很多過濾及計(jì)算功能我們可以自己使用perl或者python編寫腳本實(shí)現(xiàn),但都不如這個(gè)工具的運(yùn)算速度快。

基本參數(shù)

輸入?yún)?shù)

  • –vcf <input_filename> 支持v4.0、v4.1或者v4.2版本的VCF文件

  • –gzvcf <input_filename> 通過gzipped壓縮過的VCF文件

  • –bcf <input_filename> BCF2文件

輸出參數(shù)

  • –out <output_prefix> 輸出文件,后面直接對(duì)輸出文件命名

  • –stdout 可接管道符對(duì)輸出結(jié)果進(jìn)行重新定向

  • –temp <temporary_directory> 指定結(jié)果的輸出目錄

過濾參數(shù)

根據(jù)位置過濾

  • –chr <chromosome>

  • –not-chr <chromosome>
    包含或排除匹配的染色體位點(diǎn)

  • –from-bp

  • –to-bp
    這兩個(gè)參數(shù)需要和–chr一起使用
    指定要處理的一系列站點(diǎn)的下限和上限

  • –positions<filename>

  • –exclude-positions <filename>
    根據(jù)文件中的位置列表包括或排除一組位點(diǎn)。輸入文件的每一行應(yīng)包含(制表符分隔的)染色體和位置
    ······

根據(jù)位點(diǎn)過濾

  • –snp <string>字符串的名稱可以匹配dbSNP的數(shù)據(jù),適合人類基因組,該指令可多次使用</string>

  • –snps<filename>

  • -exclude <filename>
    包括或排除文件中給出的SNP列表

變異類型過濾

  • –keep-only-indels 只保留indel標(biāo)記

  • –remove-indels 刪除indel標(biāo)記

根據(jù)flag過濾

  • –remove-filtered-all Removes all sites with a FILTER flag other than PASS.

  • –keep-filtered

  • –remove-filtered

根據(jù)INFO過濾

  • –keep-INFO<string>

  • –remove-INFO<string>

根據(jù)ALLELE過濾

  • –maf <float> MAF最小值過濾

  • –max-maf <float> MAF最大值過濾

此處省去很多參數(shù),具體參見vcftools官網(wǎng)

根據(jù)基因型數(shù)值過濾

  • –min-meanDP<float>

  • –max-meanDP <float>根據(jù)測(cè)序深度進(jìn)行過濾

  • –hwe<float>

  • –max-missing <float>完整度,該參數(shù)介于0,1之間

根據(jù)材料過濾

  • –indv

  • –remove-indv

  • –keep<filename></filename>

  • –remove<filename></filename>

  • –max-indv

基因型過濾參數(shù)

  • –remove-filtered-geno-all 排除flag不為’.’和’PASS’的基因型

  • –remove-filtered-geno <string>排除flag為string的基因型</string>

  • –minGQ <float>排除GQ低于這個(gè)參數(shù)的基因型</float>

  • –minDP<float></float>

  • –maxDP<float></float>

計(jì)算統(tǒng)計(jì)

核算多樣性統(tǒng)計(jì)

  • –site-pi 計(jì)算所有SNP

  • –window-pi

  • –window-pi-step

FST計(jì)算

  • –weir-fst-pop<filename></filename>

  • –fst-window-size

  • –fst-window-step

其它計(jì)算

  • –het

  • –hardy

  • –site-quality 主要用于提取VCF文件中每個(gè)位點(diǎn)的QUAL信```

  • --missing-indv

  • --missing-site 計(jì)算每個(gè)位點(diǎn)的缺失率

vcftools --vcf test.recode.vcf --missing-site  --out ms
  • –SNPdensity <integer>計(jì)算SNP在設(shè)定bin內(nèi)的密度</integer>

...太多了詳情見參考手冊(cè)

輸出格式

  • –recode

  • –recode-bcf

  • –recode-INFO

  • –recode-INFO-all

  • –contigs

格式轉(zhuǎn)換

  • –012

  • –IMPUTE

  • –ldhat

  • –ldhat-geno

  • –BEAGLE-GL

  • –BEAGLE-PL

  • –plink

vcftools --vcf all.filter.vcf --plink --out aa ;
  • –plink-tped

  • –chrom-map

比較選項(xiàng)

  • DIFF VCF FILE

  • –diff<filename></filename>

  • –gzdiff<filename></filename>

  • –diff-bcf<filename></filename>

  • –diff-site

  • –diff-indv

  • –diff-site-discordance

  • –diff-indv-discordance

  • –diff-indv-map<filename></filename>

  • –diff-discordance-matrix

  • –diff-switch-error

實(shí)例

1.輸出來自染色體1的輸入vcf文件中所有位點(diǎn)的等位基因頻率

vcftools --gzvcf input_file.vcf.gz --freq --chr 1 --out chr1_analysis

2.從輸入vcf文件輸出新的vcf文件,該文件刪除任何indel位點(diǎn)

vcftools --vcf input_file.vcf --remove-indels --recode --recode-INFO-all --out SNPs_only

3.輸出文件比較兩個(gè)vcf文件中的站點(diǎn)

vcftools --gzvcf input_file1.vcf.gz --gzdiff input_file2.vcf.gz --diff-site --out in1_v_in2

4.將新的vcf文件輸出到標(biāo)準(zhǔn)輸出,沒有任何具有過濾器標(biāo)記的位點(diǎn),然后使用gzip壓縮它

vcftools --gzvcf input_file.vcf.gz --remove-filtered-all --recode --stdout | gzip -c > output_PASS_only.vcf.gz

5.為bcf文件中的每個(gè)站點(diǎn)輸出Hardy-Weinberg p值,該站點(diǎn)沒有任何缺失的基因型

vcftools --bcf input_file.bcf --hardy --max-missing 1.0 --out output_noMissing

6.在一系列位置輸出核苷酸多樣性

zcat input_file.vcf.gz | vcftools --vcf - --site-pi --positions SNP_list.txt --out nucleotide_diversity

以上是“vcftools基本參數(shù)有哪些”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI