溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python爬蟲會不會讓你進小黑屋

發(fā)布時間:2020-11-23 11:08:45 來源:億速云 閱讀:156 作者:小新 欄目:編程語言

了解python爬蟲會不會讓你進小黑屋?這個問題可能是我們日常學習或工作經常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純热荩屛覀円黄饋砜纯窗桑?/p>

來交代一下,你抓了多少數(shù)據(jù),在哪抓的,干什么用了,看夠在里面待幾年。

從去年開始看到好幾起因為抓取數(shù)據(jù)而遭遇訴訟,有的鋃鐺入獄,有的被處罰金,從案件的模糊描述來看,我看得后背發(fā)涼,似乎每個爬蟲選手都有被KO的風險。

PS:這里討論的是網絡爬蟲技術本身,爬蟲技術的手法可以用來抓群數(shù)據(jù),還可以做其它事情,比如登錄社交賬號自動發(fā)帖,比如刷搜索排名等等。

《刑法》對網絡爬蟲的定罪依據(jù)

《刑法》第 285 條,非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪。

獲取該計算機信息系統(tǒng)中存儲、處理或者傳輸?shù)臄?shù)據(jù),或者對該計算機信息系統(tǒng)實施非法控制,

處三年以下有期徒刑或者拘役,并處或者單處罰金; 最高處七年有期徒刑并處罰金。

《刑法》第285條是對爬取數(shù)據(jù)的主要定罪依據(jù),有興趣可以去查下中華人民共和國刑法。

定罪的幾個案例:

從已有案例來看有以下幾種情況:

1.數(shù)據(jù)擁有者有證據(jù)能夠舉證你的數(shù)據(jù)是抓取來的。如下,今日頭條對起訴上海晟品法院宣判結果。

python爬蟲會不會讓你進小黑屋

圖片文字來自中國判決文書網。

從文書描述來看,修改UA,修改device id,繞開網站訪問頻率控制這是寫爬蟲的基本,這些手法反而成為了獲罪的依據(jù)。

2.用戶社交數(shù)據(jù),尤其是用戶隱私相關。

python爬蟲會不會讓你進小黑屋

圖片文字來自新浪網

3.擾亂對方網站經營規(guī)則,且牟利。比如這個:

python爬蟲會不會讓你進小黑屋

python爬蟲會不會讓你進小黑屋

圖片文字來自中國永嘉公號

圖上描述做搜索引擎排名的技術,其實就是利用爬蟲技術規(guī)?;脑L問網頁。

在我們通常的認知里,因為互聯(lián)網推崇分享精神,所以認為只要是網絡公開數(shù)據(jù)就可以抓取,但是通過上面的案例來看,

有幾個禁忌,抓取的數(shù)據(jù)最好不要直接商用,涉及社交信息/用戶信息要謹慎, 老板交代你抓取敏感任務時,讓老板先看下刑法第285條。

這不代表個人行為就沒事,只是還沒入他們的法眼。

在數(shù)據(jù)抓取這方面,美國也有一個判決案例,美國一家小公司向法院起訴Linkedin,理由是Linkedin通過技術手段阻止他抓取Linkedin上的數(shù)據(jù),

而且法院判定這家公司勝訴,裁定Linkedin不準屏蔽這家公司的抓取行為。

目前我國法律是偏向數(shù)據(jù)擁有者的,如果數(shù)據(jù)擁有著者有證據(jù)向法院起訴的話,抓取數(shù)據(jù)的一方多半會敗訴。

另外在抓取過程中,如果破解/反編譯對方客戶端、軟件,破解加密算法,

比如你抓某APP數(shù)據(jù),去反編譯他的客戶端,這絕對是犯法,這是破壞計算機信息系統(tǒng)罪。

爬蟲有風險,開爬要謹慎。

感謝各位的閱讀!看完上述內容,你們對python爬蟲會不會讓你進小黑屋大概了解了嗎?希望文章內容對大家有所幫助。如果想了解更多相關文章內容,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI