您好,登錄后才能下訂單哦!
如何理解對(duì)GEO數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行差異分析的工具GEO2R,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。
GEO數(shù)據(jù)庫(kù)中的數(shù)據(jù)是公開(kāi)的,很多的科研工作者會(huì)下載其中的數(shù)據(jù)自己去分析,其中差異表達(dá)分析是最常見(jiàn)的分析策略之一,為了方便大家更好的挖掘GEO中的數(shù)據(jù),官網(wǎng)提供了一個(gè)工具GEO2R
, 可以方便的進(jìn)行差異分析。
從名字也可以看出,該工具實(shí)現(xiàn)的功能就是將GEO數(shù)據(jù)庫(kù)中的數(shù)據(jù)導(dǎo)入到R語(yǔ)言中,然后進(jìn)行差異分析,本質(zhì)上是通過(guò)以下兩個(gè)bioconductor上的R包實(shí)現(xiàn)的
GEOquery
limma
GEOquery
用于自動(dòng)下載GEO數(shù)據(jù),并讀取到R環(huán)境中;limma
是一個(gè)經(jīng)典的差異分析軟件,用于執(zhí)行差異分析。
一組樣本在GEO數(shù)據(jù)庫(kù)中用series
表示,比如GSE25724
, 包含了case和control兩組樣本,case組包含6個(gè)生物學(xué)重復(fù),control組包含7個(gè)生物學(xué)重復(fù),共13個(gè)樣本,鏈接如下
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25724
在網(wǎng)頁(yè)上可以看到GEO2R
的按鈕,點(diǎn)擊這個(gè)按鈕就可以進(jìn)行分析了, 除了差異分析外,GEO2R
還提供了一些簡(jiǎn)單的數(shù)據(jù)可視化功能。
該選項(xiàng)用箱線圖展示所有樣本中表達(dá)量的分布,結(jié)果示意如下
該選項(xiàng)用于展示某個(gè)探針/基因在所有樣本中的分布,結(jié)果示意如下
點(diǎn)擊Sample values
, 可以看到對(duì)應(yīng)的表達(dá)量值,示意如下
GEO2R
進(jìn)行差異分析的步驟如下
通過(guò)Define groups
按鈕定義樣本分組,首先輸入一個(gè)group的名字,然后選擇對(duì)應(yīng)的樣本,示意如下
通過(guò)頁(yè)面下方的Options
菜單,可以調(diào)整差異分析時(shí)的參數(shù),示意如下
第一個(gè)參數(shù)用于選擇多重假設(shè)檢驗(yàn)的P值校正算法,第二個(gè)參數(shù)表示是否對(duì)原始的表達(dá)量進(jìn)行l(wèi)og轉(zhuǎn)換,第三個(gè)參數(shù)調(diào)整最終結(jié)果中展示的對(duì)應(yīng)的platfrom的注釋信息,是基于客戶提供的supplement file中的信息, 還是使用soft
文件中的信息。
點(diǎn)擊如下所示的Top 250
按鈕,執(zhí)行差異分析。
結(jié)果示意如下,在頁(yè)面上只顯示最顯著的250個(gè)差異基因
全部基因的結(jié)果可以通過(guò)Save all results
導(dǎo)出,通過(guò)GEO2R
, 可以在沒(méi)有任何編程基礎(chǔ)的情況下,順序的完成差異分析。
看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。