溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何使用Rtsne包進行t-SNE降維分析

發(fā)布時間:2021-11-10 16:37:40 來源:億速云 閱讀:315 作者:柒染 欄目:大數(shù)據(jù)

今天就跟大家聊聊有關(guān)如何使用Rtsne包進行t-SNE降維分析,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

t-SNE降維算法是由機器學(xué)習領(lǐng)域的大牛在2008年提出的一種高效的降維算法,屬于非線性降維算法的一種,相比之前常用的PCA算法,該算法更加的先進,應(yīng)用的領(lǐng)域也非常的多,在單細胞轉(zhuǎn)錄組的數(shù)據(jù)分析中,t-SNE應(yīng)用的更為廣泛。

在cell ranger等專門的分析單細胞數(shù)據(jù)的軟件包中,都提供了t-SNE降維和可視化分析,但是由于不同軟件對于數(shù)據(jù)數(shù)據(jù)格式的要求不同,某些情況下,無法直接使用現(xiàn)有的軟件包,比如我們可能只有一個基因在所有細胞中的表達量數(shù)據(jù),此時無法直接導(dǎo)入cell ranger或者Seurat。

由于軟件接口設(shè)置的不同,為了更加靈活的進行數(shù)據(jù)分析,我們有必要掌握一些小而美的分析工具,單一的這些工具只能完成數(shù)據(jù)分析中的某一項內(nèi)容,其功能的單一性,使得學(xué)習成本進一步降低,靈活性顯著提升。

Rtsne就是一個專門進行t-SNE降維分析的R包,安裝方式如下

install.packages("Rtsne")

只需要輸入一個表達量的表格就可以了,每一行為一個細胞,每一列為一個基因,示意如下

如何使用Rtsne包進行t-SNE降維分析

基礎(chǔ)的用法如下

tsne_out <- Rtsne(
  data,
  dims = 2,
  pca = FALSE,
  perplexity = 10,
  theta = 0.0,
  max_iter = 1000
)

dims參數(shù)設(shè)置降維之后的維度,默認值為2,perplexity參數(shù)的取值必須小于(nrow(data) - 1 )/ 3; theta參數(shù)取值越大,結(jié)果的準確度越低,默認值為0.5,max_iter參數(shù)設(shè)置最大迭代次數(shù)。

pca參數(shù)表示是否對輸入的原始數(shù)據(jù)進行PCA分析,然后使用PCA得到的topN主成分進行后續(xù)分析,t-SNE算法的計算量是特別大的,對于維度較高的數(shù)據(jù)數(shù)據(jù),先采用PCA降維可以有效提高運行的效率,默認采用top50的主成分進行后續(xù)分析,當然也可以通過initial_dims參數(shù)修改這個值。

運算完成之后,結(jié)果保存在tsne_out這個對象中

如何使用Rtsne包進行t-SNE降維分析

其中的Y就是降維之后的二維空間對應(yīng)的數(shù)據(jù)點,可以根據(jù)這個值進行可視化,代碼如下

plot(tsne_out$Y)

生成的圖片如下

如何使用Rtsne包進行t-SNE降維分析

我們需要明白t-SNE只是一個降維算法,雖然它很先進,但是也只是能夠?qū)?shù)據(jù)降低到二維或者三維空間,然后進行可視化的一個功能,對于細胞亞群的識別,本質(zhì)是通過聚類分析來得到結(jié)果的,t-SNE只是能夠更好的在低維空間展示聚類的結(jié)果而已,其他的降維算法也是同理。

看完上述內(nèi)容,你們對如何使用Rtsne包進行t-SNE降維分析有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI