溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝

發(fā)布時(shí)間:2022-01-04 17:54:12 來(lái)源:億速云 閱讀:76 作者:柒染 欄目:大數(shù)據(jù)

今天就跟大家聊聊有關(guān)怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

早在2013年的時(shí)候, 就已經(jīng)有科學(xué)家提出了利用Hi-C數(shù)據(jù)來(lái)輔助基因組組裝的思路,可以將scaffold進(jìn)一步提升到染色體級(jí)別的長(zhǎng)度,并提供了配套的分析軟件LACHESIS。該軟件默認(rèn)輸入的基因組組裝結(jié)果完全正確,后續(xù)的操作都是建立在這個(gè)前提下。然而實(shí)際情況中,受到組裝算法的限制,基因組草圖中會(huì)存在拼接錯(cuò)誤的情況。

分析思路: 首先會(huì)根據(jù)hi-c數(shù)據(jù)的結(jié)果,對(duì)輸入的基因組組裝結(jié)果中的拼接錯(cuò)誤進(jìn)行校正,然后在進(jìn)行后續(xù)分析,整個(gè)pipeline如下圖所示

怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝

可以分成以下4個(gè)大的步驟

  1. preliminary filtration

  2. misjoin correction

  3. ordering and orientation

  4. overlap merging


第一步首先對(duì)基因組組裝的結(jié)果進(jìn)行預(yù)處理,去除長(zhǎng)度太短的scafflod。長(zhǎng)度過(guò)短的scaffold在hi-c圖譜中對(duì)應(yīng)的交互信息會(huì)非常的少,沒(méi)有足夠的交互信息無(wú)法有效的進(jìn)行后續(xù)分析;第二步利用hi-c數(shù)據(jù)校正scaffold中存在的拼接錯(cuò)誤,對(duì)于檢測(cè)到存在拼接錯(cuò)誤的scaffold, 將其切割為存在拼接錯(cuò)誤的inconsistent部分和未檢測(cè)到拼接錯(cuò)誤的consistent部分,inconsistent部分不會(huì)進(jìn)行后續(xù)分析。

第三步確定歸屬同一條染色體的scaffold,并進(jìn)行排序和調(diào)整方向;第四步檢測(cè)同一條染色體上的scaffold間是否存在overlap, 對(duì)于存在overlap的scaffold, 進(jìn)行merge。

應(yīng)用該算法結(jié)合hi-c數(shù)據(jù)對(duì)埃及伊蚊的基因組結(jié)果重新組裝后,效果如下所示

怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝

可以看到,由最初的草圖組裝到了最終的染色體級(jí)別。該算法對(duì)任意的基因組組裝都是適用的,值得一提的是該文章指出,通過(guò)hi-c數(shù)據(jù)輔助基因組組裝得到的最終結(jié)果中,還是會(huì)存在部分的錯(cuò)誤結(jié)果,這個(gè)是不可避免的。

看完上述內(nèi)容,你們對(duì)怎么使用hi-C數(shù)據(jù)輔助埃及伊蚊基因組的組裝有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI