您好,登錄后才能下訂單哦!
這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)GEO數(shù)據(jù)庫架構(gòu)的原理是什么,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
GEO是一個(gè)國際化的開源項(xiàng)目,允許研究者提交自己的數(shù)據(jù)到該數(shù)據(jù)庫,在世界范圍內(nèi)公開共享自己的數(shù)據(jù),
該數(shù)據(jù)庫最開始主要用于分享芯片數(shù)據(jù),后來隨著NGS技術(shù)的發(fā)展,也支持上傳高通量測(cè)序數(shù)據(jù)。
在該數(shù)據(jù)庫中,將所有相關(guān)信息分成以下幾類,示意如下
芯片平臺(tái)或者測(cè)序平臺(tái),每個(gè)平臺(tái)有一個(gè)唯一的以GPL
開頭的編號(hào),高通量測(cè)序平臺(tái),示意如下
由測(cè)序儀和物種的組合構(gòu)成了不同的platforn,芯片平臺(tái)示意如下
芯片平臺(tái)會(huì)給出探針相關(guān)信息,比如對(duì)應(yīng)的基因,探針序列等,示意如下
sample代表的是一個(gè)樣本的數(shù)據(jù),可以是任意platform產(chǎn)生的數(shù)據(jù),有一個(gè)唯一的以GSM
開頭的編號(hào),對(duì)于芯片數(shù)據(jù),會(huì)給出探針的表達(dá)量值,示意如下
對(duì)于高通量測(cè)序數(shù)據(jù),根據(jù)數(shù)據(jù)類型會(huì)給出不同種類的文件,如果原始的測(cè)序數(shù)據(jù)有上傳到SRA數(shù)據(jù)庫,也會(huì)給出對(duì)應(yīng)SRA編號(hào),示意如下
series代表屬于同一個(gè)實(shí)驗(yàn)設(shè)計(jì)的一組樣本,通常情況下會(huì)給出該系列下所有樣本的附件文件的壓縮包,示意如下
以上這3種信息由數(shù)據(jù)的提交者提供,對(duì)于同一個(gè)series下的原始數(shù)據(jù),GEO會(huì)對(duì)其進(jìn)行簡單的挖掘,比如基于表達(dá)量進(jìn)行聚類分析等,這些分析的結(jié)果對(duì)應(yīng)的類型為DataSet
, 有一個(gè)唯一的以GDS
開頭的編號(hào),GDS2225
示意如下
基于GSE3541
的數(shù)據(jù)得到,該數(shù)據(jù)是一套大鼠的芯片數(shù)據(jù),樣本分為case和control兩組,每組3重復(fù),基于表達(dá)量的聚類結(jié)果示意如下
根據(jù)DataSet中提供的表達(dá)譜數(shù)據(jù),對(duì)于每個(gè)探針或者基因在所有樣本中表達(dá)量進(jìn)行探究,就得到了Profile
數(shù)據(jù),示意如下
數(shù)據(jù)共享使得基于公共數(shù)據(jù)庫的數(shù)據(jù)挖掘成為可能,也可以通過分析已有的同種類型數(shù)據(jù)來和自己的測(cè)序數(shù)據(jù)相互印證。
上述就是小編為大家分享的GEO數(shù)據(jù)庫架構(gòu)的原理是什么了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。