溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

agilent表達(dá)譜芯片注釋信息提取的方法

發(fā)布時(shí)間:2022-03-19 14:26:03 來源:億速云 閱讀:355 作者:iii 欄目:開發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“agilent表達(dá)譜芯片注釋信息提取的方法”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“agilent表達(dá)譜芯片注釋信息提取的方法”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識吧。

不規(guī)范的表達(dá)譜芯片注釋信息提取

1、GEO數(shù)據(jù)庫中  agilent表達(dá)譜芯片由與其設(shè)計(jì)往往比較個(gè)性化,涉及的芯片型號很多,使用的Cy5/Cy3的雙色芯片 或者僅使用Cy3的單色芯片,數(shù)據(jù)上比較混亂,而GEO中提供的GPL信息文件格式和affymetrix  、illumina 的表達(dá)譜芯片對應(yīng)的GPL格式差別較大,雖然格式整齊,并不完全規(guī)范(相對于直接利用GEOquery下載芯片注釋文件而言)。

2、若直接下載標(biāo)準(zhǔn)化數(shù)據(jù)的同時(shí),利用GEOquery下載對應(yīng)的GPL芯片平臺信息往往出現(xiàn)報(bào)錯(cuò),或者提取信息過程中出現(xiàn)提取錯(cuò)誤,這里針對 格式相對整齊統(tǒng)一的這種agilent表達(dá)譜芯片GPL信息 提供一種獲取的方法,在進(jìn)行芯片原始數(shù)據(jù)標(biāo)準(zhǔn)化的過程中直接獲得其中的注釋信息:探針和基因等對應(yīng)關(guān)系。

3、此處僅以單通道芯片數(shù)據(jù)為例: 案例數(shù)據(jù)GSE83902   基于limma包讀取數(shù)據(jù),并進(jìn)行預(yù)處理,標(biāo)準(zhǔn)化之后,獲取的結(jié)果時(shí)一個(gè)EList對象,這個(gè)對象中包含了探針和基因之間的對應(yīng)關(guān)系,先對芯片中重復(fù)的探針檢測值取均值之后,獲取的還是一個(gè)EList(此處用averEList向量表示取均值后的返回結(jié)果):

查看averEList 中對應(yīng)的genes信息,這個(gè)矩陣中包括了每一列信息如下 涉及探針ProbeName 和GeneName以及描述信息,之后提取保存即可

> colnames(averEList$genes)
 [1] "Row"            "Col"            "Start"          "Sequence"       "ProbeUID"      
 [6] "ControlType"    "ProbeName"      "GeneName"       "SystematicName" "Description"   
> Probe=averEList$genes[,c("ProbeName","GeneName","SystematicName","Description")]
> head(Probe,5)
        ProbeName        GeneName  SystematicName
1 GE_BrightCorner GE_BrightCorner GE_BrightCorner
2      DarkCorner      DarkCorner      DarkCorner
4    A_23_P117082           HEBP1       NM_015987
5   A_33_P3246448           KCNE4       NM_080671
6   A_33_P3318220          BPIFA3       NM_178466
                                                                                               Description
1                                                                                                         
2                                                                                                         
4                                        ref|Homo sapiens heme binding protein 1 (HEBP1), mRNA [NM_015987]
5 ref|Homo sapiens potassium voltage-gated channel, Isk-related family, member 4 (KCNE4), mRNA [NM_080671]
6 ref|Homo sapiens BPI fold containing family A, member 3 (BPIFA3), transcript variant 1, mRNA [NM_178466]

注意: 不同芯片獲取的EList結(jié)果中可以EList$genes 獲取的矩陣涉及的列名不一致,具體情況具體對待

讀到這里,這篇“agilent表達(dá)譜芯片注釋信息提取的方法”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI