溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析

發(fā)布時間:2022-01-17 10:39:20 來源:億速云 閱讀:1121 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要介紹了GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析的相關(guān)知識,內(nèi)容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析文章都會有所收獲,下面我們一起來看看吧。

腫瘤細胞系藥敏數(shù)據(jù)庫,如GDSC和CELL提供了腫瘤細胞系藥敏信息和對應(yīng)的基因組學(xué)信息,但是一些研究提示兩大數(shù)據(jù)庫的數(shù)據(jù)具有分歧,一些研究證實兩大數(shù)據(jù)集具有可信的一致性。


GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析

 

結(jié)果1.細胞系藥理數(shù)據(jù)集的比較

GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析  

Fig 1a: CCLE和GDSC藥物篩選數(shù)據(jù)。

  • CCLE和GDSC數(shù)據(jù)庫中存在相同的471個細胞系,并具有相關(guān)的基因組數(shù)據(jù),但其中只有部分細胞系具有重疊的藥物篩選數(shù)據(jù):每個化合物對應(yīng)的重疊范圍為82-256個細胞系(中位數(shù)= 94;均值= 157)。

Fig 1b-1c:使用半數(shù)抑制濃度(IC50)和曲線下面積(AUC;1-AUC稱為CCLE中的活性面積)對CCLE和GDSC藥敏指標進行pearson相關(guān)性分析。全部結(jié)果見補充圖。

  • 在可以直接進行GDSC-CCLE比較的情況下,幾乎所有化合物(13/15)的AUC和IC50分布均以藥物不敏感譜系為主,而藥物敏感系則少得多。“小提琴圖”顯示了每種化合物的所有CCLE和GDSC AUC值的完整分布,而散點圖則展示重疊細胞系的分布。IC50值的結(jié)果與AUC的結(jié)果相似,見補充圖。幾種靶向藥物在重疊細胞系中幾乎沒有敏感性細胞系(例如,克唑替尼2個,尼洛替尼3個,TAE684 2個,厄洛替尼或索拉非尼0個)。重疊細胞系中敏感性細胞系的相對缺乏限制了兩個數(shù)據(jù)集可達到的相關(guān)水平。
GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析  

Fig 1d-1e: pearson相關(guān)性(y軸)較spearson相關(guān)性(x軸)分析的相關(guān)性更強。

  • 相關(guān)性分析的統(tǒng)計能力:在大多數(shù)情況下,相關(guān)分析能夠在敏感和不敏感細胞系數(shù)目之間的不平衡以及原始分析方法具有差異的情況下保持良好的一致性。
  • Haibe-kains 等人基于Spearman相關(guān)性系數(shù)計算兩數(shù)據(jù)集的相關(guān)性。
  • 將Pearson相關(guān)系數(shù)與Spearman的系數(shù)進行比較,大多數(shù)藥物的相關(guān)系數(shù)都得到了明顯提高。但是某些相關(guān)值仍然很差,這可能是由于細胞系生物學(xué)上的差異、實際藥理學(xué)測量(例如nutlin-3,紫杉醇和PHA665752),或者針對某藥物的細胞系集合僅存在一種敏感系(例如erlotinib和sorafenib)。
GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析  

Fig 1f: 使用瀑布圖對耐藥株和敏感株進行分類,并將此研究(y軸)與haibe-kains研究的Cohen’kappa系數(shù)(兩個變量的一致性系數(shù))進行比較。

  • 在13種相關(guān)化合物中,平均94%的細胞系(CCLE= 94%,范圍= 77–100%;GDSC= 96%,范圍= 86–100%)聚集在藥物不敏感范圍(例如,大多數(shù)化合物的IC50值> 1μM)。
  • 瀑布圖分析還表明,在CCLE和GDSC數(shù)據(jù)之間,細胞系歸類為“敏感”或“抗性”的一致性很高(由cohen’kappa系數(shù)反映)。
GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析  
  • 擴展數(shù)據(jù)圖3:在所有測試藥物中,使用簡單的藥物敏感性臨界值(1μM)時,這種一致性也很明顯。
  • 瀑布圖和簡單閾值法都顯示出較haibe-kains等人研究的更高一致性,表明CCLE和GDSC細胞系藥理篩選數(shù)據(jù)適合用于建模研究,從而區(qū)分少見的藥物敏感性細胞系。
 

結(jié)果2.藥物敏感性預(yù)測指標的比較

探究CCLE和GDSC細胞系集合在何種程度上能夠闡明抗癌藥功效的常見遺傳學(xué)或分子基礎(chǔ)。

 

2.1 方差分析(ANOVA)

使用CCLE和GDSC上的重疊細胞系進行了方差分析(ANOVA),從而確定兩個數(shù)據(jù)集之間藥物反應(yīng)的分子相關(guān)性是否一致??偣彩褂脙蓚€模型,預(yù)測變量分別為IC50或活性面積(即1-AUC)得分,兩個模型均將起源組織視為協(xié)變量,將71個癌基因的突變狀態(tài)視為獨立變量。

GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析  

Fig 2A: ANOVA分析在13個化合物(GDSC或者CELL滿足)、8個化合物(GDSC和CELL同時滿足)鑒定出與耐藥或者敏感最相關(guān)的已知基因標志。

  • 基于IC50值的ANOVA模型,兩個數(shù)據(jù)集中均發(fā)現(xiàn)的基因標志包括NRAS突變(對MEK抑制劑PD0325901敏感)、BRAF突變(對BRAF抑制劑PLX4720)、BCR-ABL1融合基因(對多種ABL1抑制劑敏感,如nilotinib,AZD0530)以及ERBB2擴增(對ERBB2抑制劑拉帕替尼敏感)。基于活性評分和IC50的ANOVA模型結(jié)果一致,獲得兩數(shù)據(jù)集的一致性耐藥性關(guān)聯(lián),例如對nutlin-3耐藥的TP53突變。基于活性評分的ANOVA分析,GDSC的14種藥物和CCLE的15種藥物顯示出組織起源特異性的相關(guān)性,這些關(guān)聯(lián)在數(shù)據(jù)集之間是一致的(事后Welch t檢驗,見擴展數(shù)據(jù)圖5)。
 

2.2 彈性網(wǎng)絡(luò)回歸與嶺回歸分析

GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析擴展數(shù)據(jù)圖6:對21,013個基因組特征(包括表達,拷貝數(shù)變化和突變)進行了多變量分析,更全面地評估基因組預(yù)測因子的一致性。 

        使用每個研究可用的完整數(shù)據(jù)集或僅使用重疊數(shù)據(jù)集進行彈性網(wǎng)絡(luò)回歸。該分析產(chǎn)生了強勁的預(yù)測分子,并且預(yù)測分子的重疊非常顯著(χ2 P <10-8)。在至少一個數(shù)據(jù)集的13個化合物中,藥物反應(yīng)的已知預(yù)測因子作為最相關(guān)的分子。在兩個數(shù)據(jù)集的10個化合物都顯示出這種相關(guān)性,與CCLE和GDSC各自數(shù)據(jù)集所報告的結(jié)果一致。

        對兩個數(shù)據(jù)集中重疊藥物的IC50值的彈性網(wǎng)絡(luò)回歸分析確定了其他預(yù)測因子。在nutlin-3敏感性的情況下,MDM2表達和TP53突變就是一個例子。在每個數(shù)據(jù)集上單獨使用彈性網(wǎng)模型發(fā)現(xiàn)的4,957個藥物基因關(guān)聯(lián)中,僅觀察到一個分歧的結(jié)果(占比0.02%,在兩數(shù)據(jù)集中具有相反的權(quán)重系數(shù))。

GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析

Fig 2B-2D:一個數(shù)據(jù)集用彈性回歸以確定預(yù)測因子,另一個數(shù)據(jù)集用嶺回歸以驗證預(yù)測因子的作用,探索確定藥物敏感性的基因組預(yù)測因子。

        CCLE和GDSC研究中確定的預(yù)測基因組特征具有高度一致性,即使對于很少有重疊細胞系的藥物也是如此。> 80%的這些特征被確定為具有一致的方向性(標準化效應(yīng)同為正或同為負)。在某些情況下,初始彈性網(wǎng)絡(luò)回歸無法確定預(yù)測變量,這通常部分歸因于少量的藥物敏感性細胞系。另一方面,一些基于AUC或IC50表現(xiàn)出低相關(guān)性的藥物仍然能夠識別一致的預(yù)測因子(例如,nutlin-3)。

關(guān)于“GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對“GDSC與CELL數(shù)據(jù)庫的藥物基因組學(xué)一致性實例分析”知識都有一定的了解,大家如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI