溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

ImSQL:海量數(shù)據(jù),可信存儲

發(fā)布時間:2020-07-12 02:56:03 來源:網(wǎng)絡(luò) 閱讀:180 作者:wx5d84475d0a477 欄目:大數(shù)據(jù)

數(shù)據(jù)造假、數(shù)據(jù)不可信等問題的存在,給金融監(jiān)管及風(fēng)控等眾多應(yīng)用場景帶來了嚴(yán)峻的挑戰(zhàn),也正成為阻礙數(shù)據(jù)大規(guī)?;ヂ?lián)互通、共享共用的一大障礙。數(shù)據(jù)的真實可信問題長期影響著社會的各個領(lǐng)域,在更依賴數(shù)據(jù)的人工智能時代,這一影響將更為凸顯。

數(shù)據(jù)造假可能發(fā)生在任一環(huán)節(jié)。其中,在數(shù)據(jù)存儲期間造假往往更加簡單:因為在現(xiàn)有數(shù)據(jù)存儲技術(shù)下,數(shù)據(jù)的所有者、管理人員或受托存儲方均有能力單方對數(shù)據(jù)進行任意的篡改或刪除。

既然數(shù)據(jù)不可信的一個重要原因歸咎于單方可以擅自篡改和刪除數(shù)據(jù),那么如何避免這一問題自然也得到了業(yè)界大量的關(guān)注。區(qū)塊鏈和去中心化存儲技術(shù)的誕生,對數(shù)據(jù)篡改起到了一定的遏制作用,也在市場上取得了初步驗證。

許多企業(yè)開始嘗試采用區(qū)塊鏈存儲數(shù)據(jù),例如在貨物追溯等場景。其做法往往是將重要數(shù)據(jù)直接寫入?yún)^(qū)塊中。這一簡單粗暴的做法確實解決了數(shù)據(jù)防刪改需求、繼而滿足了部分?jǐn)?shù)據(jù)的可信分享,但卻存在較多問題:

首先是無法存儲海量數(shù)據(jù):區(qū)塊內(nèi)不適合存儲包括多媒體數(shù)據(jù)等在內(nèi)的大數(shù)據(jù),否則區(qū)塊大小難以控制,使區(qū)塊鏈的可擴展性變差。這就導(dǎo)致業(yè)務(wù)中必須對原生數(shù)據(jù)進行篩選取舍,僅選取少量必要數(shù)據(jù)存入?yún)^(qū)塊,但這將降低可信數(shù)據(jù)的豐富程度。

其次是數(shù)據(jù)存取效率低:首先,由于打包過程的存在,區(qū)塊鏈數(shù)據(jù)存儲一般不用于高速的數(shù)據(jù)寫入。其次,由于遍歷式的數(shù)據(jù)讀取方法,區(qū)塊鏈無法支持快速索引、更無法支持SQL。

再次是數(shù)據(jù)維護效率低:區(qū)塊鏈因其順序引用的特點,不支持對個別歷史數(shù)據(jù)的刪除和修改(除非對全鏈重新生成,但這是區(qū)塊鏈不應(yīng)鼓勵的行為)。這里需注意:“杜絕單方的私自篡改”和“完全不能刪改”是完全不同的兩件事。前者是一種確?;バ诺募夹g(shù)手段,但后者可能屬于一種必要功能點的喪失。

最后是有數(shù)據(jù)丟失風(fēng)險:這一風(fēng)險單指采用中本聰共識最長鏈原則的PoW區(qū)塊鏈系統(tǒng)。在這類區(qū)塊鏈中,當(dāng)出現(xiàn)鏈分叉時,最長(或最重)的鏈分支會被保留,其他分支會被拋棄,這就使區(qū)塊內(nèi)的數(shù)據(jù)實際上永遠存在被“顛覆”、被丟棄的風(fēng)險。而自私挖礦等行為的存在,會加劇這一風(fēng)險。這在數(shù)據(jù)存儲應(yīng)用中是無法接受的。

正是由于上述原因,直接采用傳統(tǒng)區(qū)塊鏈進行數(shù)據(jù)存儲顯然無法滿足大量實踐性場景中對可信數(shù)據(jù)存儲的需求。這一問題也因而引發(fā)了大量的探討,例如“什么數(shù)據(jù)應(yīng)該在鏈上存儲、什么數(shù)據(jù)應(yīng)該在鏈下存儲”。這些問題的出現(xiàn),究其根本,還是因為區(qū)塊鏈自身存儲效率及能力受限所致的。畢竟在數(shù)據(jù)庫時代,我們從來不會談?wù)摗笆裁磾?shù)據(jù)應(yīng)該存放在數(shù)據(jù)庫之外”這樣的問題。

近年來也出現(xiàn)了一些產(chǎn)品,為解決上述的區(qū)塊鏈數(shù)據(jù)存儲效率低下問題提供了有益的實踐,例如:

星際文件系統(tǒng)IPFS, R3的Corda,騰訊TrustSQL等。然而這些產(chǎn)品在數(shù)據(jù)可信存儲方面仍存在或多或少的問題,具體而言:

IPFS對數(shù)據(jù)內(nèi)容生成哈希摘要,并在多個節(jié)點間進行分布式存儲,單個保有者不掌握完整數(shù)據(jù),一定程度保護了數(shù)據(jù)隱私。但IPFS只能做到修改可知(因哈希值會因內(nèi)容改變而變化),并且沒有訪問控制等數(shù)據(jù)安全措施,整體而言仍難以滿足企業(yè)級服務(wù)需求。

Corda是面向金融交易隱私需求量身定做的存儲產(chǎn)品,重點關(guān)注數(shù)據(jù)存儲的隱私性。為此,Corda沒有全局賬本,并需要見證人的存在,是一種隱私但并不足夠安全可信的數(shù)據(jù)存儲方案。

TrustSQL與國內(nèi)其它同類產(chǎn)品采用了一種簡單直觀的設(shè)計思路,也是目前國內(nèi)最為常見的做法,即:先將數(shù)據(jù)存入數(shù)據(jù)庫(或IPFS),再將操作記錄、數(shù)據(jù)哈希等存于鏈上。相對于TrustSQL而言,一些類似產(chǎn)品如眾享比特的ChainSQL等進一步提升了對SQL的支持度。該類產(chǎn)品滿足了數(shù)據(jù)“可審計”、“監(jiān)管透明”的需求,但缺點是依然無法杜絕對數(shù)據(jù)本身的刪改行為,只是能做到“刪改可知”;此外,對關(guān)鍵數(shù)據(jù)的保全需要依賴參與節(jié)點的全副本存儲,存儲成本略高。并且在數(shù)據(jù)隱私性方面的設(shè)計仍顯不足。

針對上述產(chǎn)品中存在的不足,物緣科技通過原創(chuàng)技術(shù)創(chuàng)新,探索出一條不同的道路,并推出自主知識產(chǎn)權(quán)產(chǎn)品“ImSQL”,旨在提供一種可真正確保數(shù)據(jù)不被私自篡改或刪除的可信存儲產(chǎn)品。

ImSQL(Immutable SQL Database)是基于區(qū)塊鏈和分布式存儲技術(shù)上的一種新型可信數(shù)據(jù)存儲解決方案,并完美解決了“防止私自刪改”、“保護數(shù)據(jù)隱私”、“降低存儲成本”等核心問題,為大數(shù)據(jù)時代的可信存儲與數(shù)據(jù)分享提供了可靠的技術(shù)路徑。

相比現(xiàn)有產(chǎn)品,ImSQL具有以下幾點突出優(yōu)勢:

1. 徹底杜絕單方對數(shù)據(jù)的私自篡改和刪除。通過在存和取兩個環(huán)節(jié)進行多方校驗并在存儲過程中杜絕篡改刪除,全方位保障數(shù)據(jù)的真實可信性,使應(yīng)用中的參與方能夠互信、放心地采納它方數(shù)據(jù),使數(shù)據(jù)能夠支撐精準(zhǔn)追溯、追責(zé)。

2. 杜絕單點失敗。多方共用數(shù)據(jù)的同時也共同維護數(shù)據(jù),數(shù)據(jù)不只存于一方,從根本上實現(xiàn)分布式數(shù)據(jù)的可信共享池,既避免了單點失敗風(fēng)險,也提升了數(shù)據(jù)分享效率。

3. 碎片化存儲,滿足數(shù)據(jù)隱私需求,使任何一方無法掌握完整數(shù)據(jù),從而解決了傳統(tǒng)云計算的中心化存儲、或區(qū)塊鏈全副本存儲均存在的數(shù)據(jù)隱私問題。除了數(shù)據(jù)所有方,其他任何存儲托管者都無法獲得完整數(shù)據(jù)。

4. 優(yōu)異的數(shù)據(jù)存取性能:ImSQL單節(jié)點可達3000 TPS的寫入速度和10000 QPS的讀取速度。此外,ImSQL還具有:支持SQL語言,可水平擴展等優(yōu)點,存取性能和使用體驗優(yōu)異,并可充分利用集qun擴展使上述指標(biāo)進一步達到數(shù)倍增長。

5. 滿足多媒體等大數(shù)據(jù)的高效存取需求,支持高效存取、高效索引、高效擴展,真正勝任大數(shù)據(jù)業(yè)務(wù)場景,可以對視頻等數(shù)據(jù)實現(xiàn)既可信又高效的存儲,從而給視頻監(jiān)控等場景提供前所未有的可信保全體驗。

6. 采用分片式設(shè)計,極大降低了每個存儲參與方的存儲壓力和成本,使更多參與方有機會加入和參與到數(shù)據(jù)可信共享的生態(tài)中。

7. 分布式架構(gòu),兼容輕節(jié)點,鼓勵更多節(jié)點參與。不存在超能節(jié)點,參與存儲的節(jié)點地位相同,更好保證系統(tǒng)的可靠性和抗毀性。此外,如果節(jié)點選擇運行在輕副本模式,可只存儲部分?jǐn)?shù)據(jù),使自身存儲壓力極大降低,義務(wù)雖然減輕但權(quán)力可不受任何影響。

ImSQL兼顧了海量存儲、快速索引、水平擴展等數(shù)據(jù)庫屬性,也兼顧了數(shù)據(jù)即存即固化的區(qū)塊鏈特征,在眾多關(guān)注數(shù)據(jù)可信存儲與分享的領(lǐng)域中,有望帶來前所未有的使用體驗和便利,例如:實現(xiàn)供應(yīng)鏈中各方數(shù)據(jù)的互通與互信、實現(xiàn)政府或大企業(yè)各部門間數(shù)據(jù)的互聯(lián)互通、支撐可信追溯相關(guān)海量數(shù)據(jù)的存儲等。

以政府大數(shù)據(jù)建設(shè)為例。在政府眾多不同部門和實體間實現(xiàn)高效的數(shù)據(jù)互聯(lián)互通一直是個難題。現(xiàn)行做法往往需要建立獨立的大數(shù)據(jù)部門,構(gòu)建獨立數(shù)據(jù)存儲體系,從不同實體拉取相關(guān)數(shù)據(jù)后解析、重構(gòu),再實現(xiàn)可視化。這往往會帶來較大的前期開銷,既包含人、財、物等多種顯性開銷,也暗含人員編制、權(quán)責(zé)利益、時間成本、部門墻等隱性開銷。同時,獨立大數(shù)據(jù)部門的存在也隱含了需要一個可信第三方背書乃至承擔(dān)責(zé)任的考慮。如果在這一場景下采用ImSQL作為數(shù)據(jù)互通的底層基礎(chǔ)平臺,就可以更為高效的完成這一任務(wù),具體體現(xiàn)在:

  1. 無須依賴第三方實體背書:不同實體間數(shù)據(jù)可直接寫入ImSQL,寫入即保全,數(shù)據(jù)無法再被任一單方私自篡改和刪除,保證其他實體在任何時間取用數(shù)據(jù)時的可用性、一致性和可信性;

  2. 無須建立和維護額外的數(shù)據(jù)存儲系統(tǒng):數(shù)據(jù)由所有參與實體共同存儲和維護,天然共享、打通,不降低使用效率的同時減少了系統(tǒng)實施和維護成本。同時,ImSQL的數(shù)據(jù)碎片化存儲技術(shù),在實現(xiàn)數(shù)據(jù)共享的同時也能兼顧隱私保護,即,所有實體存儲的數(shù)據(jù)可以是不完整的片段,只有那些具備訪問權(quán)的實體才掌握對片段數(shù)據(jù)進行查找、組合并解釋的鑰匙。

綜上,作為一種可信的、防數(shù)據(jù)篡改的數(shù)據(jù)存儲技術(shù),ImSQL完全繼承了區(qū)塊鏈數(shù)據(jù)保全的優(yōu)勢,又突破了區(qū)塊鏈在效率方面的弱點,為用戶提供了和數(shù)據(jù)庫同樣高效的數(shù)據(jù)存取體驗。ImSQL是區(qū)塊鏈和數(shù)據(jù)庫技術(shù)相結(jié)合而產(chǎn)生的新品類,更是實現(xiàn)可信數(shù)據(jù)存儲的不二選擇。

作者信息:焦臻楨博士,物緣科技創(chuàng)始人,副教授/碩導(dǎo)(中科院)。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI