溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

GATK4是什么

發(fā)布時(shí)間:2022-03-10 11:10:52 來(lái)源:億速云 閱讀:242 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹了GATK4是什么,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

GATK 是 Genome Analysis ToolKit 的縮寫(xiě),是一款從高通量測(cè)序數(shù)據(jù)中分析變異信息的軟件,是目前最主流的snp calling 軟件之一。GATK 設(shè)計(jì)之初是用于分析人類(lèi)的全外顯子和全基因組數(shù)據(jù),隨著不斷發(fā)展,現(xiàn)在也可以用于其他的物種,還支持CNV和SV變異信息的檢測(cè)。在官網(wǎng)上,提供了完整的分析流程,叫做GATK Best Practices。

GATK4是什么
目前最新版本文為4.1.2.0, 叫做GATK4。 和之前的版本相比,GATK4在算法上進(jìn)行了優(yōu)化,運(yùn)行速率有所提高,而且整合了picard 軟件的功能。GATK4基于java 語(yǔ)言開(kāi)發(fā)的,需要java 1.8 版本。下載鏈接如下

https://software.broadinstitute.org/gatk/download/

安裝過(guò)程如下:

wget https://github.com/broadinstitute/gatk/releases/download/4.1.2.0/gatk-4.1.2.0.zip
unzip gatk-4.1.2.0.zip
tree -L 1 gatk-4.1.2.0/
gatk-4.1.2.0/
├── gatk
├── gatk-completion.sh
├── gatkcondaenv.yml
├── GATKConfig.EXAMPLE.properties
├── gatkdoc
├── gatk-package-4.1.2.0-local.jar
├── gatk-package-4.1.2.0-spark.jar
├── gatkPythonPackageArchive.zip
└── README.md

解壓縮之后,可以看到兩個(gè)后綴為.jar的文件,local用于本地運(yùn)行,spark用于在spark集群上運(yùn)行。實(shí)際使用時(shí),直接用gatk這個(gè)可執(zhí)行文件就行了。

通過(guò)一個(gè)簡(jiǎn)單的命令,查看程序是否正確安裝

gatk —list

這個(gè)命令能夠打印出所有的子命令,如果打印出來(lái)結(jié)果,說(shuō)明程序安裝正確。部分子命令截圖如下

GATK4是什么

子命令后面如果有(picard), 說(shuō)明這個(gè)功能是繼承于picard軟件,從這里也可以看出,GATK4集成了picard軟件的功能。再不需要像之前版本一樣,混合使用picard 和 gatk 了。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“GATK4是什么”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI