溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何用Python記錄那些被爛片收割的智商稅

發(fā)布時間:2021-10-28 18:22:05 來源:億速云 閱讀:95 作者:柒染 欄目:編程語言

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何用Python記錄那些被爛片收割的智商稅,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

前言

隨著電影行業(yè)的蓬勃發(fā)展,越來越多的電影出現(xiàn)在了觀眾的視野中,豐富了大家的生活,好的電影也能讓大家在放松自我的同時收獲一些對人生的思考。


然而,也有那么一些“爛片”,讓大家在看過之后“添堵”,后悔為這種“爛片”貢獻票房,白白被收割了“智商稅”,今天,我們就用Python來幾年那些被爛片收割走的智商稅。

數(shù)據(jù)獲取

這次的數(shù)據(jù)源也是大家的老朋友,被親切地稱之為“馬蜂窩”的豆瓣網(wǎng),現(xiàn)在有很多平臺會對電影進行打分,包括了貓眼和淘票票,但是相較之下,豆瓣的評分更加全面,一些冷門的“爛片”只能在豆瓣中被大家挖掘出來。

誠然,豆瓣的評分會存在一些“文藝濾鏡”,對文藝片比較寬容,對此我們認(rèn)為,“豆瓣評分高的不一定是真的高,但是被豆瓣打了低分的是真的低”。此次選擇的影片范圍是2010年至今的國產(chǎn)影片:

如何用Python記錄那些被爛片收割的智商稅

最終獲取到了3000多部電影的數(shù)據(jù),代碼如下:

## 爬取劇集列表,并輸出成為excel表格
driver = webdriver.Chrome()
driver.maximize_window()
driver.close()
driver.switch_to_window(driver.window_handles[0])
url = 'https://movie.douban.com/tag/#/?sort=U&range=2,10&tags=%E7%94%B5%E5%BD%B1,2010%E5%B9%B4%E4%BB%A3,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86'
js='window.open("'+url+'")'
driver.execute_script(js)
driver.close()
driver.switch_to_window(driver.window_handles[0])
while True:
 try:
 js="var q=document.documentElement.scrollTop=10000000" 
 driver.execute_script(js)
 driver.find_element_by_class_name('more').click()
 time.sleep(2)
 except:
 break 
name = [k.text for k in driver.find_elements_by_class_name('title')]
score = [k.text for k in driver.find_elements_by_class_name('rate')]
url = [k.get_attribute('href') for k in driver.find_elements_by_class_name('item')]
pd.DataFrame({'name':name,'score':score,'url':url}).to_excel('電影名稱.xlsx')

整體數(shù)據(jù)


首先要做的事情就是看一下豆瓣對國產(chǎn)電影的整體打分情況,以此確定之后對“爛片”的劃分依據(jù),首先看一下整體評分的柱形圖:

如何用Python記錄那些被爛片收割的智商稅


可以看到豆瓣用戶對國產(chǎn)片還是比較嚴(yán)格,大多數(shù)電影都是在6分一下,8分以上的電影可以說是“鳳毛麟角”,因此后續(xù)對爛片的標(biāo)準(zhǔn)也要相應(yīng)放低,下面看一下各個將分?jǐn)?shù)向下取整后的統(tǒng)計數(shù)量:

如何用Python記錄那些被爛片收割的智商稅


2010年之后獲得9分的國產(chǎn)電影只有一部,可以說是非常的不易,大家可以猜一下是哪部電影,看看是不是你心中的9分電影


下面為大家揭開謎底:

如何用Python記錄那些被爛片收割的智商稅


唯一一部獲得9分的就是18年上映的《我不是藥神》,未來也希望能有更多這樣的優(yōu)秀影片,而且這種期望也是有依據(jù)的,我們看一下每一年爛片和非爛片的占比:

如何用Python記錄那些被爛片收割的智商稅


可以看到從爛片和超級爛片占比在16年達到頂峰之后,從17年開始爛片占比在逐漸下降,相信未來爛片的占比也會逐漸下降


人氣榜

有了整體的綜述后,我們確定了爛片和超級爛片的劃分依據(jù),將4分之下的影片劃分為爛片,3分以下的影片劃分為超級爛片,下面就分別來看看各自的人氣榜:

如何用Python記錄那些被爛片收割的智商稅


可以看到在所有的影片中,人氣TOP10的影片評分都還是不錯,流浪地球,藥神和哪吒也都在票房中有非常不錯的表現(xiàn),顯然,這不是我們需要,我們下面就來看下爛片和超級爛片中的人氣榜:

如何用Python記錄那些被爛片收割的智商稅

如何用Python記錄那些被爛片收割的智商稅


熱烈恭喜《上海堡壘》憑借2.9分的評分和217110的評價數(shù)喜提兩項人氣榜的冠軍,《愛情公寓》因為“大忽悠”式的營銷也躋身榜單,不知道即將上映的《愛情公寓5》能否為這一系列挽回一些口碑


票房榜

同樣,我們來分別看下所有影片、爛片和超級爛片的票房排行,看看究竟是哪些“爛片”在瘋狂收割著大家的智商稅,首先看一下左右影片的票房榜:

如何用Python記錄那些被爛片收割的智商稅

排名第10的西虹市首富票房都已經(jīng)到了25億,可見票房市場發(fā)展之迅速,今年國慶檔的兩部影片《我和我的祖國》以及《中國機長》分列八九名,相信未來這份榜單會不斷的發(fā)生變化。

《西虹市首富》同樣以6.5分的評分在榜單中評分最低,看來《西虹市首富》已經(jīng)成為了一個標(biāo)桿,6.5分也是一部票房賣座影片的底線,下面進入重點了,看一下那些瘋狂收割大家智商稅的爛片和超級爛片:

如何用Python記錄那些被爛片收割的智商稅

爛片票房榜中的TOP10都超過了2.6億,大鬧天竺和愛情公寓更是分別收獲了7.5億和5.5億的票房,瘋狂收割著大家的智商稅,相信未來隨著大家對影片要求的提高,瘋狂收割智商稅的現(xiàn)象會逐漸減少

如何用Python記錄那些被爛片收割的智商稅


令人意想不到的是,就連超級爛片的TOP10都可以收割5000萬以上的票房,更是有四部票房過億,在此提醒大家“觀影有風(fēng)險,選片需謹(jǐn)慎”


演員榜

一部爛片的誕生想必也離不開“演員”的努力,下面就來分別看看所出演電影平均分最高和最低的演員:

如何用Python記錄那些被爛片收割的智商稅


評分高的演員就無須贅述了,都是經(jīng)過了市場和觀眾的挑戰(zhàn),但是目前還沒有一位演員在主演影片數(shù)量超過5部之后,分?jǐn)?shù)可以上7,誠然有一部分是因為豆瓣對國產(chǎn)的嚴(yán)格要求,但另一方面也在敦促電影人不斷進步


下面看一下評分排在倒數(shù)的演員,首先看下BOTTOM10:

如何用Python記錄那些被爛片收割的智商稅


看到這份榜單,有種恍惚的感覺,確認(rèn)這不是主持人或者相聲、小品演員的榜單,我們不禁要問:大家有事嗎?快樂家族更是“霸榜”,杜海濤憑借精湛的演技和出眾的外形在榜單中獨占鰲頭,相信他未來會給大家?guī)砀鼮椤绑@艷”的作品,吳亦凡也代表說唱歌手在榜單中出現(xiàn),填補了榜單中歌手的空白。

如何用Python記錄那些被爛片收割的智商稅


由于過多的“跨界”演員出現(xiàn)在了榜單BOTTOM10中,導(dǎo)致很多大家心目中的演員沒有上榜,于是我們繼續(xù)看BOTTOM11-20,這份榜單似乎正常了一點,但是好多更加應(yīng)該在電視劇中出現(xiàn)的名字也位列其中。

看來電影和電視劇還是有所區(qū)別,在電視劇中能夠大放異彩的演員未必能在電影中有同樣精彩的表現(xiàn),考慮到電視劇演員們的加入,繼續(xù)把榜單范圍放大到BOTTOM21-30:

如何用Python記錄那些被爛片收割的智商稅

這份榜單終于正常了很多,很多大家心目中的“種子選手”都不負(fù)眾望地出現(xiàn)在了榜單中,特別是黃曉明和Angelababy這對模范夫妻的上榜,進一步提高了榜單的公信力,未來也希望他們能夠繼續(xù)聯(lián)袂為大家?guī)砭首髌罚芏嗳丝赡軙硎緫岩?,對此我們的回?fù)很簡單:我不要你相信,我要我相信!

上述就是小編為大家分享的如何用Python記錄那些被爛片收割的智商稅了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI