溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python怎樣爬取某平臺短視頻

發(fā)布時間:2021-10-26 10:16:11 來源:億速云 閱讀:132 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了Python怎樣爬取某平臺短視頻,內(nèi)容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

基本開發(fā)環(huán)境

  • Python 3.6

  • Pycharm

相關模塊的使用

import os
import requests

安裝Python并添加到環(huán)境變量,pip安裝需要的相關模塊即可。

一、確定需求

Python怎樣爬取某平臺短視頻 


爬取搞笑趣味欄目的視頻內(nèi)容。

二、網(wǎng)站數(shù)據(jù)分析

首先需要明確一點,好看視頻網(wǎng)站加載方式是懶加載的方式,需要你下滑網(wǎng)頁才會加載出新的內(nèi)容 


加載出來的內(nèi)容里面有音頻播放地址以及標題。

內(nèi)容比較簡單,看代碼就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
    title = index['title']
    play_url = index['play_url']
    video_content = requests.get(url=play_url, headers=headers).content
    path = 'video\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + title + '.mp4', mode='wb') as f:
        f.write(video_content)
        print('正在保存:', title)

Python怎樣爬取某平臺短視頻

上述內(nèi)容就是Python怎樣爬取某平臺短視頻,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI