溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

發(fā)布時(shí)間:2021-11-10 10:10:58 來(lái)源:億速云 閱讀:189 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

歡迎關(guān)注”生信修煉手冊(cè)”!

OncodriveCLUST是一款驅(qū)動(dòng)基因識(shí)別軟件, 主要針對(duì)功能獲得性突變,即gain-of-funciton mutations進(jìn)行分析,這些突變通常聚集在蛋白質(zhì)的特定區(qū)域,可能是腫瘤細(xì)胞生長(zhǎng)優(yōu)勢(shì)和腫瘤細(xì)胞克隆進(jìn)化過(guò)程中正向選擇的信號(hào),通過(guò)對(duì)這些突變進(jìn)行分析,來(lái)預(yù)測(cè)潛在的驅(qū)動(dòng)基因。

對(duì)應(yīng)的文章發(fā)表在Bioinformatics上,鏈接如下

http://bioinformatics.oxfordjournals.org/content/29/18/2238.full

該軟件以基因?yàn)閱挝贿M(jìn)行分析,主要步驟分為5步,圖示如下
怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

第一步統(tǒng)計(jì)蛋白質(zhì)上每個(gè)位置的功能獲得性突變的頻率分布,結(jié)果如圖I所示,橫坐標(biāo)為蛋白質(zhì)的位置,縱坐標(biāo)表示每個(gè)位置上突變位點(diǎn)對(duì)應(yīng)的頻率;第二步篩選非隨機(jī)的突變位置,利用二項(xiàng)分布累計(jì)函數(shù)篩選非隨時(shí)的突變位置,在圖II中,虛線表示閾值,虛線以上的位置為非隨機(jī)的突變位置, 非隨機(jī)即代表有潛在的生物學(xué)意義。

第三步對(duì)這些非隨機(jī)位置進(jìn)行聚類,每個(gè)cluster對(duì)應(yīng)圖III中的灰色區(qū)域,每個(gè)cluster下相鄰的兩個(gè)位置的距離小于5個(gè)氨基酸;第四步將原始的cluster位置進(jìn)行擴(kuò)展,相鄰的區(qū)域內(nèi)突變位置也被包括進(jìn)來(lái),對(duì)應(yīng)圖IV中的灰色區(qū)域,可以看到相比圖III,灰色區(qū)域變寬了;第五步利用每個(gè)基因上的cluster對(duì)基因進(jìn)行打分。

利用基因上的同義突變按照相同的規(guī)則計(jì)算對(duì)應(yīng)的打分,作為背景,比較每個(gè)基因利用非同義突變計(jì)算出的打分是否與背景不同,從而篩選出不同于背景模型的驅(qū)動(dòng)基因。

該軟件基于python3開(kāi)發(fā),安裝過(guò)程如下

yum install  -y epel-release
yum  install -y gcc
yum  install -y gcc-c++
yum install -y python34
yum install -y python34-devel
yum install -y python34-pip
pip3 install oncodriveclust

官網(wǎng)提供了測(cè)試數(shù)據(jù)集,下載方式如下

curl -o oncodriveclust.tar.gz https://bitbucket.org/bbglab/oncodriveclust/get/0.3.tar.gz
tar xzvf oncodriveclust.tar.gz

基本用法如下

oncodriveclust \
-m 3 \
--cgc \
data/CGC_phenotype.tsv \
examples/tcga.BRCA.nonsyn.txt \
examples/tcga.BRCA.syn.txt \
data/gene_transcripts.tsv

最少需要3個(gè)輸入文件,非同義突變和同義突變對(duì)應(yīng)的txt文件,內(nèi)容示意如下

怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

最重要的是第一列和最后一列,第一列表示基因,最后一列表示突變所在的蛋白質(zhì)位置。gene_transcripts.tsv對(duì)應(yīng)的內(nèi)容如下

怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

--cgc參數(shù)指定的是基因在CGC數(shù)據(jù)庫(kù)中對(duì)應(yīng)的注釋信息,是可選的,內(nèi)容示意如下

怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

指定了這個(gè)文件,在輸出結(jié)果的第二列,會(huì)包含基因的注釋信息。運(yùn)行成功后,默認(rèn)輸出文件為oncodriveclust-results.tsv,內(nèi)容如下

怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因

根據(jù)pvalue和qvalue對(duì)結(jié)果進(jìn)行篩選,挑選顯著性的驅(qū)動(dòng)基因。

上述內(nèi)容就是怎么使用OncodriveCLUST識(shí)別驅(qū)動(dòng)基因,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI