edgeR中怎么實現(xiàn)兩組間差異分析操作

發(fā)布時間：2021-08-12 16:53:50 來源：億速云閱讀：144 作者：Leah 欄目：大數(shù)據(jù)

edgeR中怎么實現(xiàn)兩組間差異分析操作，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學(xué)習(xí)下，希望你能有所收獲。

1. 讀取文件

需要讀取基因在所有樣本中的表達量文件，示例如下

gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3
geneA 14  0  11  4  0  12
geneB 125 401 442 175 59 200

每一行為一個基因，每一列代表一個樣本。讀取數(shù)據(jù)的代碼如下

# 讀取表達量的表格
counts <- read.table(
  "gene.counts.tsv",
  header=T,
  sep="\t",
  row.names=1,
  comment.char="",
  check.names=F)

# 設(shè)置樣本分組
groups <- factor(c(1,1,1,2,2,2))

# 構(gòu)建edgeR中的對象
y <- DGEList(counts=count,group=group)

2. 過濾count數(shù)很低的基因

根據(jù)CPM表達量對基因進行過濾，代碼如下

keep <- rowSums(cpm(y)>1) >= 2
y <- y[keep, , keep.lib.sizes=FALSE]

3. 歸一化

默認采用TMM歸一化算法，計算每個樣本的 sizefactor, 代碼如下

y <- calcNormFactors(y)

4. 進行差異分析

代碼如下

design <- model.matrix(~group)
y <- estimateDisp(y,design)
et <- exactTest(y)

5. 提取結(jié)果

將差異分析的結(jié)果保存到文件中，代碼如下

res <- et$table
write.table(res, "edgeR.xls", header = T, col.names = NA, sep = "\t" )

看完上述內(nèi)容是否對您有幫助呢？如果還想對相關(guān)知識有進一步的了解或閱讀更多相關(guān)文章，請關(guān)注億速云行業(yè)資訊頻道，感謝您對億速云的支持。

向AI問一下細節(jié)

edgeR中怎么實現(xiàn)兩組間差異分析操作

1. 讀取文件

2. 過濾count數(shù)很低的基因

3. 歸一化

4. 進行差異分析

5. 提取結(jié)果

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽