溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析

發(fā)布時間:2022-03-21 09:50:13 來源:億速云 閱讀:1188 作者:iii 欄目:開發(fā)技術(shù)

本文小編為大家詳細介紹“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”,內(nèi)容詳細,步驟清晰,細節(jié)處理妥當,希望這篇“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析

Mfuzz是用來進行不同時間點轉(zhuǎn)錄組數(shù)據(jù)表達模式聚類分析的R包,使用起來非常方便,直接輸入不同樣本歸一化后的counts或者FPKM及TPM值就可進行聚類。輸入文件的格式很簡單:

行為基因,列為樣本,保存為制表符分隔的txt文件。

## 安裝R包
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("Mfuzz")
## 加載R包
library("Mfuzz")
## 導入基因表達量
gene <- read.table("input.txt",header = T,row.names=1,sep="\t")
## 轉(zhuǎn)換格式
gene_tpm <- data.matrix(gene)
eset <- new("ExpressionSet",exprs = gene_tpm)
## 過濾缺失超過25%的基因
gene.r <- filter.NA(eset, thres=0.25)

由于輸入的表達量中不允許有缺失值NA出現(xiàn),所以我們要填補缺失值。

## mean填補缺失
gene.f <- fill.NA(gene.r,mode="mean")
## knn/wknn方法表現(xiàn)更好,但是計算起來比較復雜
gene.f <- fill.NA(gene.r,mode="knn")
gene.f <- fill.NA(gene.r,mode="wknn")
## 過濾標準差為0的基因
tmp <- filter.std(gene.f,min.std=0)
## 標準化
gene.s <- standardise(tmp)

聚類時,我們需要輸入兩個參數(shù),c和m。c是我們期望的聚類個數(shù),由自己定義。m由mestimate計算得到。

## 聚類個數(shù)
c <- 6
## 計算最佳的m值
m <- mestimate(gene.s)
## 聚類
cl <- mfuzz(gene.s, c = c, m = m)
## 查看每類基因數(shù)目
cl$size
## 查看每類基因ID
cl$cluster[cl$cluster == 1]
## 輸出基因ID
write.table(cl$cluster,"output.txt",quote=F,row.names=T,col.names=F,sep="\t")
## 繪制折線圖
mfuzz.plot(gene.s,cl,mfrow=c(2,3),new.window= FALSE)

讀到這里,這篇“R語言中如何使用Mfuzz進行轉(zhuǎn)錄組基因表達模式聚類分析”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI