溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何理解CGA中的分析結(jié)果

發(fā)布時(shí)間:2021-11-23 15:57:45 來(lái)源:億速云 閱讀:179 作者:柒染 欄目:大數(shù)據(jù)

今天就跟大家聊聊有關(guān)如何理解CGA中的分析結(jié)果,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

TCGA對(duì)于不同類型的數(shù)據(jù),有著獨(dú)特的處理流程,具體如下

1. DNA-Seq Analysis Pipeline

TCGA中的DNA測(cè)序主要用來(lái)分析腫瘤患者中的體細(xì)胞突變,和GATK的體細(xì)胞突變流程類似,前期都經(jīng)過(guò)了一個(gè)預(yù)處理步驟,這里稱之為co-cleanning, 流程示意如下

如何理解CGA中的分析結(jié)果

就是經(jīng)典的sort->markduplicate->Realign->BQSR步驟,得到co-cleaned BAM文件。然后用配對(duì)的腫瘤和正常樣本進(jìn)行somatic variant calling,  得到VCF文件。然后進(jìn)行體細(xì)胞突變的注釋,得到突變注釋文件MAF, 示意如下

如何理解CGA中的分析結(jié)果

在進(jìn)行體細(xì)胞突變位點(diǎn)分析時(shí),使用了以下4款不同的軟件同時(shí)分析

  1. MuSE

  2. Mutect2

  3. SomaticSniper

  4. Varscan2


各自對(duì)應(yīng)的pipeline示意如下

如何理解CGA中的分析結(jié)果
如何理解CGA中的分析結(jié)果
如何理解CGA中的分析結(jié)果
如何理解CGA中的分析結(jié)果

各自pipeline得到的VCF文件,使用VEP軟件對(duì)體細(xì)胞突變位點(diǎn)進(jìn)行注釋,使用了以下數(shù)據(jù)庫(kù)進(jìn)行注釋

  1. GENCODE v.22

  2. sift v.5.2.2

  3. ESP v.20141103

  4. polyphen v.2.2.2

  5. dbSNP v.146

  6. Ensembl genebuild v.2014-07

  7. Ensembl regbuild v.13.0

  8. HGMD public v.20154

  9. ClinVar v.201601


注釋完成之后,會(huì)對(duì)突變位點(diǎn)進(jìn)行過(guò)濾,去除低質(zhì)量的突變位點(diǎn)和潛在的生殖細(xì)胞突變位點(diǎn),剩余的位點(diǎn)作為最終的體細(xì)胞突變位點(diǎn),保存在MAF文件中供下載。

當(dāng)然對(duì)于沒有配對(duì)的正常樣本,也有tumor-only variant calling workflow來(lái)處理,具體請(qǐng)參考以下鏈接

https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline

2.  mRNA Analysis Pipeline

mRNA分析是通過(guò)STAR的2-pass模式比對(duì)hg38參考基因組,然后使用HTSeq進(jìn)行定量,定量時(shí)基于Gencode V22版本的GTF文件,流程示意如下

如何理解CGA中的分析結(jié)果

在定量時(shí),提供了以下3種策略

  1. Raw count

  2. FPKM

  3. FPKM-UQ


Raw count和FPKM是轉(zhuǎn)錄組分析中經(jīng)典的定量策略,而FPKM-UQ則是在FPKM基礎(chǔ)上新提出的一種策略,計(jì)算公式如下

如何理解CGA中的分析結(jié)果

和FPKM不同的是,在FPKM-UQ中采用所有基因Mapping reads數(shù)目的上四分位數(shù)代替了所有基因Mapping Reads的總數(shù)。官方也提供了一個(gè)示例幫助我們理解具體的計(jì)算過(guò)程

如何理解CGA中的分析結(jié)果

3. miRNA Analysis Pipeline

miRNA的分析采用了BCGSC開發(fā)的miRNA定量流程,這套流程只針對(duì)已知的miRNA進(jìn)行定量,鏈接如下

https://github.com/bcgsc/mirna

流程示意如下

如何理解CGA中的分析結(jié)果

4. Copy Number Variation Analysis Pipeline

使用Affymetrix SNP 6.0芯片來(lái)分析CNV, 首先使用DNACopy這個(gè)R包來(lái)計(jì)算拷貝數(shù),然后用GISTIC2根據(jù)CNV來(lái)評(píng)估基因的變化情況,是loss還是gain, 流程示意如下

如何理解CGA中的分析結(jié)果

5. Methylation Liftover Pipeline

通過(guò)illumina Infinum Human Methylation 27和HumanMethylation450 兩個(gè)芯片平臺(tái)來(lái)分析DNA甲基化,采用了beta值的定量策略。同時(shí)考慮到這兩個(gè)探針是針對(duì)hg19來(lái)設(shè)計(jì)的,將探針序列與hg38進(jìn)行比對(duì),當(dāng)MAPQ<10或者I型和II型探針比對(duì)到不同基因組區(qū)域時(shí),過(guò)濾到這部分探針。剩余的CpG文件根據(jù)GENCODE V22版本的GTF來(lái)進(jìn)行注釋,根據(jù)這樣的策略將hg19上的甲基化移植到hg38版本的基因組上,具體流程示意如下

如何理解CGA中的分析結(jié)果

了解TCGA數(shù)據(jù)分析的流程,可以更好的在GDC數(shù)據(jù)庫(kù)中篩選數(shù)據(jù),也可以更好的和自己的數(shù)據(jù)進(jìn)行比較。

看完上述內(nèi)容,你們對(duì)如何理解CGA中的分析結(jié)果有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

cga
AI