溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

發(fā)布時間:2020-08-16 08:58:48 來源:ITPUB博客 閱讀:162 作者:千鋒Python唐小強 欄目:編程語言

周杰倫作為天王,具有劃時代的意義毋庸置疑,他的歌伴隨了多少個90后的日日夜夜,是多少人的回憶和情懷!

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

9 月 16 日晚間,一代天王周董發(fā)布了最新單曲 《說好不哭》

發(fā)布后,真的讓一波人哭了

一群想搶鮮聽的小伙伴直接淚奔

因為 QQ 音樂直接被搞崩了

沒想到干翻 QQ 音樂的不是網易云音樂

也不是蝦米音樂

而是周董!

周董成成功地憑一己之力干翻了 QQ 音樂

那么聽過周董新歌后的小伙伴都是怎么評價的呢?

這里,我們獲取了 QQ 音樂的近 20W 條評論數(shù)據進行分析

看看其中有哪些有趣的東西

一、數(shù)據獲取

1、請求分析

在 QQ 網頁版直接搜索『說好不哭』

很容易就能找到單曲頁面

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

說好不哭

拉到頁面最下方

可以看到評論的分頁查看按鈕

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

分頁查看

按下 F12 點擊第二頁

在請求流中就可以看到對應的請求

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

評論請求

其中可以看到兩個重要參數(shù): pagenum 和  pagesize

將請求 copy 到 Postman 中進行測試

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

Postman測試

發(fā)現(xiàn)可以直接獲取到數(shù)據

連 Header 都不需要添加

這里嘗試對請求參數(shù)進行了精簡

最終只需要如下幾個參數(shù)即可

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

參數(shù)精簡

從 Postman 中可以直接獲取到對應的代碼

import requests
url = "https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h6.fcg"
querystring = {"biztype":"1","topid":"237773700","cmd":"8","pagenum":"1","pagesize":"25"}
response = requests.request("GET", url, params=querystring)
print(response.text)

這里是單頁評論的獲取

所有評論的獲取只需遞增 pagenum 即可

2、數(shù)據解析

返回數(shù)據中有很多暫時不需要的字段

這里我們只取其中的用戶名、評論時間、評論內容、點贊數(shù)

對應如下字段

{ "nick": "丨那壹刻永遠消失\"\"", "praisenum": 1, "rootcommentcontent": "越聽越好聽怎么回事!", "time": 1568729836,}

由于數(shù)據量較大 這里我們暫時將數(shù)據存放在 Excel 中

一來無須依賴外部數(shù)據庫

二來可以使用 Excel 對數(shù)據進行二次處理

數(shù)據存儲代碼如下:

def file_do(list_info, file_name): # 獲取文件大小 if not os.path.exists(file_name): wb = openpyxl.Workbook() page = wb.active page.title = 'jay' page.append(['昵稱','時間','點贊數(shù)','評論']) else: wb = openpyxl.load_workbook(file_name) page = wb.active for info in list_info: try: page.append(info) except Exception: print(info) wb.save(filename=file_name)

二、數(shù)據可視化

1、各時段的評論數(shù)

首先我們對評論按小時區(qū)間進行匯總

由于時間粒度比較小,這里對時間粒度進行了一些處理

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

評價人數(shù)走勢圖

周董的新曲是在 9.16 號 23 點準時發(fā)布的

可以看出在發(fā)布后的一個小時內(23:00-24:00)

評論數(shù)量達到了高峰

占了總評論數(shù)的一半以上

另外看了一眼 9.16 23 點之前的評論也很有意思

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

一種搬好小板凳嗑著瓜子坐等的既視感

2、大家都在說什么

詞云生成的方法有很多

可以用代碼生成

也可以用一些在線工具

這里我就使用了在線詞云工具:wordart

后續(xù)可以給大家單獨再普及一下

生成效果如下

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

詞云

周杰倫、杰倫字眼很明顯

還有大量跑來『打卡』的

『好聽』、『來了』、『哭了』、『愛了』

其中少不了的還有『青春』

另外『阿信』的出現(xiàn)估計給了很多人驚喜

3、大家都點贊了哪些評論

我們以點贊數(shù)對評論進行了排序

排名靠前的評論是如下一些

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

評論排名

另外,QQ 音樂官方也會放出精彩評論

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

熱心網友昀愷丶

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

涼城

周董新歌《說好不哭》上線,20W評論,歌迷都說了些啥

蝸牛..

對比下可以看出和我們獲取到的數(shù)據是比較一致的

只不過官方并不是按點贊個數(shù)進行排名的

看得出來這些排名靠前的大都是在回憶青春

這些評論之所以能夠得到大家的共鳴

也許他們的青春里都有一個周杰倫吧

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI