您好,登錄后才能下訂單哦!
這篇文章將為大家詳細(xì)講解有關(guān)ANNOVAR是一款什么軟件,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
ANNOVAR 是一款變異位點(diǎn)注釋軟件,提供了多方位的注釋功能,支持多個(gè)物種,是最受歡迎的注釋軟件之一。
支持的物種包括以下6種:
huamn
mouse
worm
fly
yeast
others
ANNOVAR 對于學(xué)術(shù)和非盈利機(jī)構(gòu)而言是免費(fèi)下載的,只需要注冊個(gè)賬號就可以了。下載之后,解壓縮即可。解壓縮之后的文件列表如下
├── annotate_variation.pl ├── coding_change.pl ├── convert2annovar.pl ├── example ├── humandb ├── retrieve_seq_from_fasta.pl ├── table_annovar.pl └── variants_reduction.pl
ANNOVAR
是用perl語言編寫的,由一系列的perl腳本構(gòu)成。其中annotate_variation.pl
是最核心的腳本。
安裝好之后,第一步就是下載相關(guān)的數(shù)據(jù)庫,命令如下
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar refGene humandb/
-downdb
表明該命令的用途是下載數(shù)據(jù)庫,-buildver
指定基因組版本,默認(rèn)為hg18
, -webform
指定下載的鏈接,默認(rèn)是ucsc
, refGene
代表的是下載的數(shù)據(jù)庫的名字,humandb
表示數(shù)據(jù)庫存儲(chǔ)的路徑。
對于指定版本的參考基因組而言,可以通過如下命令查看其所有的數(shù)據(jù)庫
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar avdblist hg19_list/
用法和第一個(gè)示例相同,只不過數(shù)據(jù)庫的名字指定為avdblist
, 下載成功后會(huì)有
一個(gè)對應(yīng)的avdblist.txt
,部分內(nèi)容如下
hg19_abraom.txt.gz 20180312 23198051 hg19_abraom.txt.idx.gz 20180312 9837067 hg19_AFR.sites.2012_04.txt.gz 20140106 277370590 hg19_AFR.sites.2012_04.txt.idx.gz 20140106 22362560 hg19_ALL.sites.2010_11.txt.gz 20140106 179456415 hg19_ALL.sites.2010_11.txt.idx.gz 20140106 21944132 hg19_ALL.sites.2011_05.txt.gz 20140106 232127231
每一行代表一個(gè)數(shù)據(jù)庫文件。
參考基因組相關(guān)數(shù)據(jù)庫準(zhǔn)備好之后,就可以進(jìn)行注釋了。
第一步就是準(zhǔn)備輸入文件,輸入文件有兩種格式
ANNOVAR
自定義的格式,用空格或者制表符分隔,最少需要5列,分別代表染色體,起始位置,終止位置,參考基因組的堿基,變異之后的堿基,其他的列作為額外補(bǔ)充信息,示例如下
1 948921 948921 T C comments: rs15842, a SNP in 5' UTR of ISG15 1 13211293 13211294 TC - comments: rs59770105, a 2-bp deletion 1 11403596 11403596 - AT comments: rs35561142, a 2-bp insertion
VCF格式在之前的文章中介紹過了,這里不再贅述。VCF是突變分析的一種標(biāo)準(zhǔn)格式,大多數(shù)軟件都支持這種格式的輸出。
ANNOVAR
可以識別的格式就這兩種,當(dāng)你有其他格式的snp calling結(jié)果時(shí),可以使用convert2annovar.pl
進(jìn)行格式轉(zhuǎn)換。比如將VCF和pileup
格式的文件轉(zhuǎn)換為annovar
的輸入格式
convert2annovar.pl -format pileup variant.pileup -outfile variant.query convert2annovar.pl -format vcf4 variantfile -outfile variant.avinput
ANNOVAR
軟件的功能可以分成以下4大類
分析變異位點(diǎn)對蛋白質(zhì)的影響,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等。
分析變異位點(diǎn)是否位于基因組上的特殊區(qū)域,比如轉(zhuǎn)錄因子結(jié)合區(qū)域,組蛋白修飾區(qū)等。
分析變異位點(diǎn)是否位于指定的數(shù)據(jù)庫中,比如dbSNP, 1000G,ESP 6500等數(shù)據(jù)庫,計(jì)算SIFT
,PolyPhen
, LRT
, MutationTaster
, MutationAssessor
, FATHMM
, MetaSVM
, MetaLR
等指標(biāo)。
從基因組上根據(jù)坐標(biāo)提取序列等小功能。
在實(shí)際分析中,主要使用annovar
的注釋功能??梢钥吹?,annovar
提供了3大類型的注釋。
關(guān)于“ANNOVAR是一款什么軟件”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯(cuò),請把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。