被遺忘權(quán)的崩塌：當(dāng)AI可以通過你的朋友了解你

發(fā)布時間：2020-08-11 13:34:09 來源：ITPUB博客閱讀：165 作者：naojiti 欄目：互聯(lián)網(wǎng)科技

在智能推薦無處不在的今天，相信我們每個人都或多或少患上了隱私焦慮癥。平時和朋友說話聊天都疑神疑鬼覺得手機在偷聽，很多人也因此越來越不喜歡在社交媒體上發(fā)布信息了。

不說、不轉(zhuǎn)、不點贊，看起來似乎是非常合理的“隱私三連”——如果我不留下任何數(shù)據(jù)痕跡，機器學(xué)習(xí)自然也沒辦法對我的喜好進行分析了。

可事實真的如此嗎?

精準(zhǔn)預(yù)測你的社交媒體行為，只需要9位互關(guān)好友

最近在《自然》雜志中，來自佛蒙特大學(xué)的數(shù)據(jù)科學(xué)家們公布了這樣一項研究，在推特上無需查看個人用戶數(shù)據(jù)，而是通過對個人用戶互相關(guān)注好友的推文數(shù)據(jù)分析，就能實現(xiàn)對個人用戶社交媒體行為的精準(zhǔn)預(yù)測。

換句話說，就算你刪號退網(wǎng)，機器學(xué)習(xí)仍然可以通過你的好友列表來分析出你的用戶畫像。

在研究中，研究人員收集了一萬三千余個推特賬號，這些用戶分別都擁有150-200個好友。在好友中找到互動率最高的前9位并進行分組，將用戶好友組中好友的行為數(shù)據(jù)以時間為線索進行分析。

數(shù)據(jù)科學(xué)家們通過研究得出，一般社交媒體用戶，只要不是專注某一領(lǐng)域的KOL，通常在社交媒體上使用的詞匯不超過5000個。如果用中文來比喻，大概就是“哈哈哈哈”“不轉(zhuǎn)不是中國人”“我家哥哥太帥了吧”這些常規(guī)詞匯。

被遺忘權(quán)的崩塌：當(dāng)AI可以通過你的朋友了解你

而通過對用戶好友的常用詞分析，基本可以圈定該用戶的興趣范圍。研究者提到，很多專注于某一領(lǐng)域的用戶(比如政治)，其實在社交媒體用詞量上只有幾百個單詞。在興趣范圍內(nèi)的詞匯量中引入代表個人行為變化的熵率，再與建立在時間序列上的文本生成算法相結(jié)合，就能夠?qū)崿F(xiàn)通過社交關(guān)系來預(yù)測個人社交媒體行為。

而當(dāng)好友組中的好友數(shù)量越多時，這種預(yù)測也越準(zhǔn)確。但值得注意的是，一旦好友數(shù)量超過150人，預(yù)測的準(zhǔn)確率反而會下降——因為好友數(shù)量過多時往往雙方的關(guān)聯(lián)度降低，脫離了一個本來的興趣圈子，在行為上也很難形成映射關(guān)系。

也就是說，如果你微博好友都是戰(zhàn)狼團，那么你也會和大家一起“雖遠(yuǎn)必誅”，如果你的微博是追星陣地，那么你也會深夜和姐妹們一起為idol打榜。一個人的網(wǎng)友圈子，決定了他的認(rèn)知范圍，也進而使得其行為可以被預(yù)測。

看來，人類的本質(zhì)是復(fù)讀機無誤了。

圈層豎立起高墻，隱私在內(nèi)部塌陷

這一研究雖然展示了自然語言處理能力的進步，卻也證實了兩個我們擔(dān)憂已久的問題。

首先，通過推特好友的言行對于用戶的言行進行精準(zhǔn)推測，無疑是為信息繭房理論投了一張成立票。

自從桑斯坦的信息繭房假設(shè)被傳播開以來，關(guān)于這一假設(shè)的認(rèn)可程度其實長期處于不穩(wěn)定的狀態(tài)之下。尤其是近些年來社交媒體和個性化信息流的火熱，更讓很多人常常把信息繭房四字掛在嘴邊。支持者認(rèn)為算法推薦會源源不斷的把符合用戶興趣的信息推薦給用戶，最終導(dǎo)致用戶認(rèn)知閉塞，缺乏對世界的完整化理解。

其反對者認(rèn)為，人天生就會對所接受的信息表現(xiàn)出興趣趨向，即使是報紙和書本時代，人們也會選擇自己感興趣的內(nèi)容來閱讀。而這種選擇并不會形成所謂“信息傳播阻礙”“對外部世界的認(rèn)知疏離”，所謂的繭房假說也不能成立了。

可佛蒙特大學(xué)在這次研究中提出了觀點——人之于信息，很多時候不僅是興趣選擇，還存有社交選擇。社交媒體上朋友的興趣、語言風(fēng)格、活躍時間與個人用戶社交媒體行為存在的強關(guān)聯(lián)，意味著一個人信息繭房是通過社交圈層搭建起來的，而這種繭房已經(jīng)直接作用在用戶的表達能力上，例如在研究中出現(xiàn)的一個有趣現(xiàn)象，越是對政治話題感興趣的用戶，在社交媒體上發(fā)言的詞匯量越匱乏。某種程度上，這證明了信息繭房下的傳播圈層障礙越來越明顯，長期浸淫在某一圈層的人，不僅僅失去了接受其他圈層信息的機會，也失去了接受其他圈層信息的能力。

被遺忘權(quán)的崩塌：當(dāng)AI可以通過你的朋友了解你

更可怕的是，通過互關(guān)好友摸清用戶喜好這種技術(shù)，終于讓我們失去了個人隱私的最后一片領(lǐng)地。

奧地利法學(xué)家舍恩伯格曾經(jīng)出版過一本名為《刪除：忘記是在數(shù)字時代的美德》的書，講述的是個人信息在互聯(lián)網(wǎng)上的被遺忘權(quán)，那些關(guān)于個人用戶的信息，個人用戶應(yīng)有權(quán)要求網(wǎng)站和平臺從服務(wù)器端徹底刪除或者限制訪問。

一開始人們對被遺忘權(quán)的要求還只停留在強制拍賣、失信名單這一類個人負(fù)面信息上，但很快相關(guān)需求開始變得越來越廣泛。例如2013年左右曾經(jīng)很流行一種工具，可以根據(jù)用戶主頁鏈接找到那些曾經(jīng)被用戶刪除微博、豆瓣等信息，當(dāng)時被很多人用來進行人肉搜索，以至于再次激起了人們對于被遺忘權(quán)的強烈需求。

到今天被遺忘權(quán)已經(jīng)被寫進歐盟的GDPR，注銷賬號、刪除一切已經(jīng)成了我們捍衛(wèi)網(wǎng)絡(luò)隱私的最后一條防線?？伞昂糜阉惴ā钡某霈F(xiàn)意味著，只要對方能找到你的好友關(guān)系，即使你刪去了一切內(nèi)容，依然可以會將自己赤裸的展示在算法面前。

這也讓Facebook這樣靠探知用戶信息盈利的企業(yè)可以在倫理上鉆空子——假如一位用戶堅持不給社交媒體授權(quán)數(shù)據(jù)權(quán)限，但他的社交媒體好友都向社交媒體開放了權(quán)限，社交媒體平臺很可能會“合理合法地”繞過用戶本身獲取用戶信息。

自我的副本

世界上第一個發(fā)現(xiàn)天然放射性現(xiàn)象的物理學(xué)家，來自法國貝克勒爾在被放射性物質(zhì)奪走生命時，恐怕也從為想到過這項讓自己奉獻了一生的技術(shù)，未來會演變成奪走了無數(shù)人生命的核彈。

世事總是如此，那個無意中打開潘多拉魔盒的人，往往看不到被魔盒改變過的世界的模樣。

這種社交媒體預(yù)測算法也是一樣，在同樣的邏輯下我們幾乎可以想象到：是否通過對一個主婦購物數(shù)據(jù)的分析，也能獲知她丈夫刮胡子的頻率?是否在職場社交軟件上簡單分析，就能獲知一個人的工作能力和薪資水平?

在數(shù)字化生存和AI的共同作用下，“自我”的所有權(quán)已經(jīng)形成副本并被無限分割，散落在那些一切與我們產(chǎn)生關(guān)聯(lián)的地方——我們的朋友的喜好、我們家人的行為、我們愛人的一舉一動……以至于從這些關(guān)聯(lián)之中，也能挖掘出得碎片，還原出我們的自我。

面對這種可能，我們很難現(xiàn)在就為其下一個“好或壞”的定論。但這一次，讓法律法規(guī)走在技術(shù)前面，或許是個不錯的選擇。

向AI問一下細(xì)節(jié)

被遺忘權(quán)的崩塌：當(dāng)AI可以通過你的朋友了解你

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽