溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

ANNOVAR是一款什么軟件

發(fā)布時(shí)間:2022-01-17 10:57:49 來源:億速云 閱讀:214 作者:小新 欄目:大數(shù)據(jù)

這篇文章將為大家詳細(xì)講解有關(guān)ANNOVAR是一款什么軟件,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

ANNOVAR 是一款變異位點(diǎn)注釋軟件,提供了多方位的注釋功能,支持多個(gè)物種,是最受歡迎的注釋軟件之一。

支持的物種包括以下6種:

  1. huamn

  2. mouse

  3. worm

  4. fly

  5. yeast

  6. others


ANNOVAR 對于學(xué)術(shù)和非盈利機(jī)構(gòu)而言是免費(fèi)下載的,只需要注冊個(gè)賬號就可以了。下載之后,解壓縮即可。解壓縮之后的文件列表如下

├── annotate_variation.pl
├── coding_change.pl
├── convert2annovar.pl
├── example
├── humandb
├── retrieve_seq_from_fasta.pl
├── table_annovar.pl
└── variants_reduction.pl

ANNOVAR是用perl語言編寫的,由一系列的perl腳本構(gòu)成。其中annotate_variation.pl是最核心的腳本。

安裝好之后,第一步就是下載相關(guān)的數(shù)據(jù)庫,命令如下

annotate_variation.pl -downdb -buildver hg19 -webfrom annovar refGene humandb/

-downdb表明該命令的用途是下載數(shù)據(jù)庫,-buildver指定基因組版本,默認(rèn)為hg18, -webform指定下載的鏈接,默認(rèn)是ucsc, refGene代表的是下載的數(shù)據(jù)庫的名字,humandb表示數(shù)據(jù)庫存儲(chǔ)的路徑。

對于指定版本的參考基因組而言,可以通過如下命令查看其所有的數(shù)據(jù)庫

annotate_variation.pl -downdb -buildver hg19 -webfrom annovar avdblist hg19_list/

用法和第一個(gè)示例相同,只不過數(shù)據(jù)庫的名字指定為avdblist, 下載成功后會(huì)有
一個(gè)對應(yīng)的avdblist.txt,部分內(nèi)容如下

hg19_abraom.txt.gz      20180312        23198051
hg19_abraom.txt.idx.gz  20180312        9837067
hg19_AFR.sites.2012_04.txt.gz   20140106        277370590
hg19_AFR.sites.2012_04.txt.idx.gz       20140106        22362560
hg19_ALL.sites.2010_11.txt.gz   20140106        179456415
hg19_ALL.sites.2010_11.txt.idx.gz       20140106        21944132
hg19_ALL.sites.2011_05.txt.gz   20140106        232127231

每一行代表一個(gè)數(shù)據(jù)庫文件。

參考基因組相關(guān)數(shù)據(jù)庫準(zhǔn)備好之后,就可以進(jìn)行注釋了。

第一步就是準(zhǔn)備輸入文件,輸入文件有兩種格式

1. input

ANNOVAR自定義的格式,用空格或者制表符分隔,最少需要5列,分別代表染色體,起始位置,終止位置,參考基因組的堿基,變異之后的堿基,其他的列作為額外補(bǔ)充信息,示例如下

1 948921 948921 T C comments: rs15842, a SNP in 5' UTR of ISG15
1 13211293 13211294 TC - comments: rs59770105, a 2-bp deletion
1 11403596 11403596 - AT comments: rs35561142, a 2-bp insertion
2. VCF

VCF格式在之前的文章中介紹過了,這里不再贅述。VCF是突變分析的一種標(biāo)準(zhǔn)格式,大多數(shù)軟件都支持這種格式的輸出。

ANNOVAR可以識別的格式就這兩種,當(dāng)你有其他格式的snp calling結(jié)果時(shí),可以使用convert2annovar.pl進(jìn)行格式轉(zhuǎn)換。比如將VCF和pileup格式的文件轉(zhuǎn)換為annovar的輸入格式

convert2annovar.pl -format pileup variant.pileup -outfile variant.query
convert2annovar.pl -format vcf4 variantfile -outfile variant.avinput

ANNOVAR軟件的功能可以分成以下4大類

1. gene-based annotation

分析變異位點(diǎn)對蛋白質(zhì)的影響,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等。

2. region-based annotation

分析變異位點(diǎn)是否位于基因組上的特殊區(qū)域,比如轉(zhuǎn)錄因子結(jié)合區(qū)域,組蛋白修飾區(qū)等。

3. Filter-based annotation

分析變異位點(diǎn)是否位于指定的數(shù)據(jù)庫中,比如dbSNP, 1000G,ESP 6500等數(shù)據(jù)庫,計(jì)算SIFT,PolyPhen, LRT, MutationTaster, MutationAssessor, FATHMM, MetaSVM, MetaLR等指標(biāo)。

4. other functionalities

從基因組上根據(jù)坐標(biāo)提取序列等小功能。

在實(shí)際分析中,主要使用annovar的注釋功能??梢钥吹?,annovar提供了3大類型的注釋。

關(guān)于“ANNOVAR是一款什么軟件”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯(cuò),請把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI