您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關(guān)大數(shù)據(jù)脫敏是什么,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
大數(shù)據(jù)脫敏,又稱數(shù)據(jù)漂白、數(shù)據(jù)去隱私化或數(shù)據(jù)變形,是指對某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù),從而在開發(fā)、測試和其它非生產(chǎn)環(huán)境以及外包環(huán)境中安全地使用脫敏后的真實(shí)數(shù)據(jù)集。
隱私數(shù)據(jù)脫敏技術(shù)
通常在大數(shù)據(jù)平臺(tái)中,數(shù)據(jù)以結(jié)構(gòu)化的格式存儲(chǔ),每個(gè)表有諸多行組成,每行數(shù)據(jù)有諸多列組成。根據(jù)列的數(shù)據(jù)屬性,數(shù)據(jù)列通??梢苑譃橐韵聨追N類型:
可確切定位某個(gè)人的列,稱為可識(shí)別列,如身份證號(hào),地址以及姓名等。
單列并不能定位個(gè)人,但是多列信息可用來潛在的識(shí)別某個(gè)人,這些列被稱為半識(shí)別列,如郵編號(hào),生日及性別等。美國的一份研究論文稱,僅使用郵編號(hào),生日和性別信息即可識(shí)別87%的美國人。
包含用戶敏感信息的列,如交易數(shù)額,疾病以及收入等。
其他不包含用戶敏感信息的列。
隱私數(shù)據(jù)泄露類型
隱私數(shù)據(jù)泄露可以分為多種類型,根據(jù)不同的類型,通常可以采用不同的隱私數(shù)據(jù)泄露風(fēng)險(xiǎn)模型來衡量防止隱私數(shù)據(jù)泄露的風(fēng)險(xiǎn),以及對應(yīng)不同的數(shù)據(jù)脫敏算法對數(shù)據(jù)進(jìn)行脫敏。一般來說,隱私數(shù)據(jù)泄露類型包括:
個(gè)人標(biāo)識(shí)泄露。當(dāng)數(shù)據(jù)使用人員通過任何方式確認(rèn)數(shù)據(jù)表中某條數(shù)據(jù)屬于某個(gè)人時(shí),稱為個(gè)人標(biāo)識(shí)泄露。個(gè)人標(biāo)識(shí)泄露最為嚴(yán)重,因?yàn)橐坏┌l(fā)生個(gè)人標(biāo)識(shí)泄露,數(shù)據(jù)使用人員就可以得到具體個(gè)人的敏感信息。
屬性泄露,當(dāng)數(shù)據(jù)使用人員根據(jù)其訪問的數(shù)據(jù)表了解到某個(gè)人新的屬性信息時(shí),稱為屬性泄露。個(gè)人標(biāo)識(shí)泄露肯定會(huì)導(dǎo)致屬性泄露,但屬性泄露也有可能單獨(dú)發(fā)生。
成員關(guān)系泄露。當(dāng)數(shù)據(jù)使用人員可以確認(rèn)某個(gè)人的數(shù)據(jù)存在于數(shù)據(jù)表中時(shí),稱為成員關(guān)系泄露。成員關(guān)系泄露相對風(fēng)險(xiǎn)較小,個(gè)人標(biāo)識(shí)泄露與屬性泄露肯定意味著成員關(guān)系泄露,但成員關(guān)系泄露也有可能單獨(dú)發(fā)生。
以上就是大數(shù)據(jù)脫敏是什么,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。