R語言的ssGSEA.r怎么使用

發(fā)布時間：2022-03-21 09:45:06 來源：億速云閱讀：521 作者：iii 欄目：開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“R語言的ssGSEA.r怎么使用”，內(nèi)容詳細(xì)，步驟清晰，細(xì)節(jié)處理妥當(dāng)，希望這篇“R語言的ssGSEA.r怎么使用”文章能幫助大家解決疑惑，下面跟著小編的思路慢慢深入，一起來學(xué)習(xí)新知識吧。

ssGSEA.r 單樣本基因集富集分析

使用方法：

$Rscript ../scripts/ssGSEA.r -h
usage: ../scripts/ssGSEA.r [-h] -i expset -g geneset [-o outdir] [-p prefix]
ssGSEA免疫侵潤分析
optional arguments:
  -h, --help            show this help message and exit
  -i expset, --expset expset
                        input gene expression set matrix from RNA-seq data csv
                        format [required]
  -g geneset, --geneset geneset
                        input gene set database [required]
  -o outdir, --outdir outdir
                        output file directory [default cwd]
  -p prefix, --prefix prefix
                        output file name prefix [default demo]

參數(shù)說明：

-i 基因表達(dá)量，建議用TPM標(biāo)準(zhǔn)化之后的數(shù)據(jù)：

ID	TCGA-D7-A74A-01A-11R-A32D-31	TCGA-BR-7704-01A-11R-2055-13	TCGA-VQ-A91N-01A-11R-A414-31	TCGA-CD-A4MH-01A-11R-A251-31
NUP50	18.65505	31.59232	28.23382	28.76485
CXCR4	64.85805	125.123	56.35244	69.98976
NT5E	111.4818	69.8587	79.37382	25.05824
EFNA3	8.247857	42.03308	43.46432	26.66024
STC1	4.781111	21.36327	40.81077	19.51568
ZBTB7A	95.51678	103.4768	158.3024	126.2677
CLDN9	1.187456	2.476138	0.366081	7.347344

-g 基因集兩列數(shù)據(jù)，第一列細(xì)胞類型，第二列為基因

CellType	Symbol
B cells	MS4A1
B cells	TCL1A
B cells	MS4A1
B cells	TCL1A
B cells	HLA-DOB
B cells	PNOC
B cells	KIAA0125
B cells	CD19
B cells	CR2
B cells	IGHG1
B cells	FCRL2
B cells	BLK
B cells	IGHG1
B cells	COCH
B cells	OSBPL10
B cells	IGHA1
B cells	TNFRSF17
B cells	ABCB4
B cells	BLNK

結(jié)果說明：

得到每一個樣本的不同基因集中的NES值：

NES值：用最大值與最小值間的絕對差對ssGSEA分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)化。

cell_type	TCGA-B7-A5TK-01A-12R-A36D-31	TCGA-BR-7959-01A-11R-2343-13	TCGA-IN-8462-01A-11R-2343-13	TCGA-BR-A4CR-01A-11R-A24K-31
aDC	0.612130511	0.452721422	0.434065	0.352635
B cells	0.423322775	0.408870064	0.426612	0.413857
Blood vessels	0.68102349	0.775438572	0.689433	0.577667
CD8 T cells	0.675615385	0.650073242	0.629121	0.566048
Cytotoxic cells	0.621056151	0.425217442	0.411617	0.3128
DC	0.619838925	0.485055579	0.489101	0.266905
Eosinophils	0.502784949	0.514938557	0.469541	0.488051
iDC	0.531619756	0.49843721	0.530931	0.390699
Lymph vessels	0.710842769	0.721323072	0.658391	0.500574

方法說明：

單樣本基因集富集分析（single sample gene set enrichment analysis, ssGSEA），是GSEA方法的擴展，主要是針對單個樣本無法做GSEA而設(shè)計。文章2009年發(fā)表于nature，題目為Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1。

首先對給定樣本的基因表達(dá)值進(jìn)行秩次標(biāo)準(zhǔn)化，然后利用經(jīng)驗累積分布函數(shù)計算富集分?jǐn)?shù)（ES）。設(shè)給定基因集為G，包含基因數(shù)為NG，給定單個樣本為S，表達(dá)譜包含基因數(shù)為N，N個基因按它們絕對表達(dá)值從高到低確定秩次。i 從1賦值到N，依此計算PGw和PNG。

讀到這里，這篇“R語言的ssGSEA.r怎么使用”文章已經(jīng)介紹完畢，想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會，如果想了解更多相關(guān)內(nèi)容的文章，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

R語言的ssGSEA.r怎么使用

使用方法：

參數(shù)說明：

結(jié)果說明：

方法說明：

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽