<td id="sh62q"></td>

<fieldset id="sh62q"></fieldset>

<sub id="sh62q"></sub>

<td id="sh62q"></td>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Python如何爬取某拍短視頻

發(fā)布時(shí)間：2021-06-11 11:26:49 來(lái)源：億速云閱讀：179 作者：小新欄目：開(kāi)發(fā)技術(shù)

這篇文章主要介紹Python如何爬取某拍短視頻，文中介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們一定要看完！

一、抓取目標(biāo)

目標(biāo)網(wǎng)址：美拍視頻

Python如何爬取某拍短視頻

二、工具使用

開(kāi)發(fā)環(huán)境：win10、python3.7
開(kāi)發(fā)工具：pycharm、Chrome
工具包：requests、xpath、base64

三、重點(diǎn)學(xué)習(xí)內(nèi)容

爬蟲(chóng)采集數(shù)據(jù)的解析過(guò)程
js代碼調(diào)試技巧
js逆向解析代碼
Python代碼的轉(zhuǎn)換

四、項(xiàng)目思路解析

進(jìn)入到網(wǎng)站的首頁(yè)
挑選你感興趣的分類
根據(jù)首頁(yè)地址獲取到進(jìn)入詳情頁(yè)面的超鏈接的跳轉(zhuǎn)地址

Python如何爬取某拍短視頻

找到對(duì)應(yīng)加密的視頻播放地址數(shù)據(jù)

Python如何爬取某拍短視頻

這個(gè)數(shù)據(jù)是靜態(tài)的網(wǎng)頁(yè)數(shù)據(jù)，通過(guò)js代碼進(jìn)行解碼的
找到對(duì)應(yīng)的解析代碼
先找到視頻的播放地址
找到解析視頻地址的加密js文件
點(diǎn)擊播放的時(shí)候會(huì)觸發(fā)文件

Python如何爬取某拍短視頻

大致能看出來(lái)這個(gè)是base64加密之后的數(shù)據(jù)
在對(duì)應(yīng)的js文件里搜索關(guān)鍵字
找到j(luò)s的加密方式

Python如何爬取某拍短視頻

js函數(shù)的一些函數(shù)的用法

# eplace()方法用于在字符串中用一些字符替換另一些字符
    # parseInt 數(shù)據(jù)轉(zhuǎn)換成對(duì)應(yīng)的整型
    # base64.atob   對(duì)base64編碼過(guò)的字符串進(jìn)行解碼
    # substring 方法可在字符串中抽取從 start 下標(biāo)開(kāi)始的指定數(shù)目的字符

Python如何爬取某拍短視頻

將js代碼轉(zhuǎn)換成Python代碼

import base64

def decode(data):
    def getHex(a):
        return {
            'str': a[4:],
            'hex': ''.join(list(a[:4])[::-1]),
        }

    def getDec(a):
        b = str(int(a, 16))
        return {
            'pre': list(b[:2]),
            'tail': list(b[2:]),
        }

    def substr(a, b):
        c = a[0: int(b[0])]
        d = a[int(b[0]): int(b[0]) + int(b[1])]
        return c + a[int(b[0]):].replace(d, "")

    def getPos(a, b):
        b[0] = len(a) - int(b[0]) - int(b[1])
        return b

    b = getHex(data)
    c = getDec(b['hex'])
    d = substr(b['str'], c['pre'])
    return base64.b64decode(substr(d, getPos(d, c['tail'])))

print(decode("e121Ly9tBrI84RdnZpZGVvMTAubWVpdHVkYXRhLmNvbS82MGJjZDcwNTE3NGZieXBueG5udnRwMTA5N19IMjY0XzFfNWY3YThmM2U0MTEwNy5tc2JVjAu3EDQ="))

得出最終視頻播放地址

Python如何爬取某拍短視頻

五、簡(jiǎn)易源碼分享

import requests
from lxml import etree
import base64

def decode_mp4(data):
    def getHex(a):
        return {
            'str': a[4:],
            'hex': ''.join(list(a[:4])[::-1]),
        }

    def getDec(a):
        b = str(int(a, 16))
        return {
            'pre': list(b[:2]),
            'tail': list(b[2:]),
        }

    def substr(a, b):
        c = a[0: int(b[0])]
        d = a[int(b[0]): int(b[0]) + int(b[1])]
        return c + a[int(b[0]):].replace(d, "")

    def getPos(a, b):
        b[0] = len(a) - int(b[0]) - int(b[1])
        return b

    b = getHex(data)
    c = getDec(b['hex'])
    d = substr(b['str'], c['pre'])
    return base64.b64decode(substr(d, getPos(d, c['tail'])))
# 運(yùn)行主函數(shù)
def main():
    url = 'https://www.meipai.com'
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36',
    }
    response = requests.get(url=url, headers=headers)
    html_data = etree.HTML(response.text)
    href_list = html_data.xpath('//div/a/@href')
    # print(href_list)
    for href in href_list:
        res = requests.get('https://www.meipai.com' + href, headers=headers)
        html = etree.HTML(res.text)
        name = html.xpath('//div[@id="detailVideo"]/img/@alt')[0]
        mp4_data = html.xpath('//div[@id="detailVideo"]/@data-video')[0]
        # print(name, mp4_data)
        mp4_url = decode_mp4(mp4_data).decode('utf-8')
        print(mp4_url)
        result = requests.get("http:" + mp4_url)
        with open(name + ".mp4", 'wb') as f:
            f.write(result.content)
            f.close()


if __name__ == '__main__':
    main()

以上是“Python如何爬取某拍短視頻”這篇文章的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對(duì)大家有幫助，更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
怎么解決springdataJPA對(duì)原生sql支持的問(wèn)題
下一篇新聞：
怎么在Java并發(fā)包中使用ThreadPoolExecutor線程池

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<button id="zknul"></button>

<sub id="zknul"><td id="zknul"></td></sub>