您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關(guān)如何理解CGA中的分析結(jié)果,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
TCGA對(duì)于不同類型的數(shù)據(jù),有著獨(dú)特的處理流程,具體如下
TCGA中的DNA測(cè)序主要用來(lái)分析腫瘤患者中的體細(xì)胞突變,和GATK的體細(xì)胞突變流程類似,前期都經(jīng)過(guò)了一個(gè)預(yù)處理步驟,這里稱之為co-cleanning
, 流程示意如下
就是經(jīng)典的sort->markduplicate->Realign->BQSR步驟,得到co-cleaned BAM文件。然后用配對(duì)的腫瘤和正常樣本進(jìn)行somatic variant calling, 得到VCF文件。然后進(jìn)行體細(xì)胞突變的注釋,得到突變注釋文件MAF, 示意如下
在進(jìn)行體細(xì)胞突變位點(diǎn)分析時(shí),使用了以下4款不同的軟件同時(shí)分析
MuSE
Mutect2
SomaticSniper
Varscan2
各自對(duì)應(yīng)的pipeline示意如下
各自pipeline得到的VCF文件,使用VEP軟件對(duì)體細(xì)胞突變位點(diǎn)進(jìn)行注釋,使用了以下數(shù)據(jù)庫(kù)進(jìn)行注釋
GENCODE v.22
sift v.5.2.2
ESP v.20141103
polyphen v.2.2.2
dbSNP v.146
Ensembl genebuild v.2014-07
Ensembl regbuild v.13.0
HGMD public v.20154
ClinVar v.201601
注釋完成之后,會(huì)對(duì)突變位點(diǎn)進(jìn)行過(guò)濾,去除低質(zhì)量的突變位點(diǎn)和潛在的生殖細(xì)胞突變位點(diǎn),剩余的位點(diǎn)作為最終的體細(xì)胞突變位點(diǎn),保存在MAF文件中供下載。
當(dāng)然對(duì)于沒有配對(duì)的正常樣本,也有tumor-only variant calling workflow來(lái)處理,具體請(qǐng)參考以下鏈接
https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline
mRNA分析是通過(guò)STAR的2-pass模式比對(duì)hg38參考基因組,然后使用HTSeq進(jìn)行定量,定量時(shí)基于Gencode V22版本的GTF文件,流程示意如下
在定量時(shí),提供了以下3種策略
Raw count
FPKM
FPKM-UQ
Raw count和FPKM是轉(zhuǎn)錄組分析中經(jīng)典的定量策略,而FPKM-UQ則是在FPKM基礎(chǔ)上新提出的一種策略,計(jì)算公式如下
和FPKM不同的是,在FPKM-UQ中采用所有基因Mapping reads數(shù)目的上四分位數(shù)代替了所有基因Mapping Reads的總數(shù)。官方也提供了一個(gè)示例幫助我們理解具體的計(jì)算過(guò)程
miRNA的分析采用了BCGSC開發(fā)的miRNA定量流程,這套流程只針對(duì)已知的miRNA進(jìn)行定量,鏈接如下
https://github.com/bcgsc/mirna
流程示意如下
使用Affymetrix SNP 6.0芯片來(lái)分析CNV, 首先使用DNACopy
這個(gè)R包來(lái)計(jì)算拷貝數(shù),然后用GISTIC2
根據(jù)CNV來(lái)評(píng)估基因的變化情況,是loss
還是gain
, 流程示意如下
通過(guò)illumina Infinum Human Methylation 27和HumanMethylation450 兩個(gè)芯片平臺(tái)來(lái)分析DNA甲基化,采用了beta
值的定量策略。同時(shí)考慮到這兩個(gè)探針是針對(duì)hg19來(lái)設(shè)計(jì)的,將探針序列與hg38進(jìn)行比對(duì),當(dāng)MAPQ<10或者I型和II型探針比對(duì)到不同基因組區(qū)域時(shí),過(guò)濾到這部分探針。剩余的CpG文件根據(jù)GENCODE V22版本的GTF來(lái)進(jìn)行注釋,根據(jù)這樣的策略將hg19上的甲基化移植到hg38版本的基因組上,具體流程示意如下
了解TCGA數(shù)據(jù)分析的流程,可以更好的在GDC數(shù)據(jù)庫(kù)中篩選數(shù)據(jù),也可以更好的和自己的數(shù)據(jù)進(jìn)行比較。
看完上述內(nèi)容,你們對(duì)如何理解CGA中的分析結(jié)果有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。