溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么用python爬取喜馬拉雅全站音頻

發(fā)布時(shí)間:2021-07-13 15:23:13 來(lái)源:億速云 閱讀:295 作者:chen 欄目:大數(shù)據(jù)

       喜馬拉雅FM是一個(gè)知名的音頻分享平臺(tái),在移動(dòng)音頻行業(yè)的市場(chǎng)占有率已達(dá)73%,用戶規(guī)模突破4.8億,今晚我們就帶大家突破層層障礙,探秘喜馬拉雅的天籟之音,實(shí)現(xiàn)實(shí)時(shí)抓捕并保存到本地。

怎么用python爬取喜馬拉雅全站音頻

      開發(fā)環(huán)境:Windows 、pycharm 、 requests 、 json

       知識(shí)點(diǎn):

       1、網(wǎng)絡(luò)反爬技術(shù)

       2、文件操作

       3、數(shù)據(jù)轉(zhuǎn)換

       4、字典、字符串、列表數(shù)據(jù)類型的使用

       同樣,我們要求使用火狐瀏覽器或者Google瀏覽器;我們接下來(lái)要確定幾件事:

        1、確定網(wǎng)址(喜馬拉雅網(wǎng)址)

        2、網(wǎng)絡(luò)請(qǐng)求獲取數(shù)據(jù)(點(diǎn)開我們想要的音頻)

        3、數(shù)據(jù)篩選(篩選我們想要的音頻)

        4、保存數(shù)據(jù)(保存我們需要的音頻)

 

怎么用python爬取喜馬拉雅全站音頻

部分程序如下:

url = “https://www.ximalaya.com/revision/play/album?albumId=291718&psgeNum=1&sort=1&page”

response = requests.get(url,headers=header).text

audio_data = json.loads(response)[“data”][“tracksAudioPlay”]

for audio_in   in audio_data:

    music_url = audio_info[“src”]

    “https://fdfs.xmcdn.com/group61/M05/70/C1/wKgMcFoJCZuw9cSkAB9RrgvYaVU283.m4a”

     music_name = music_url.split(“/”)[-1]

.....

怎么用python爬取喜馬拉雅全站音頻

      完整視頻關(guān)注公眾號(hào)(自學(xué)的仙叔)或者掃描下面二維碼,在公眾號(hào)中回復(fù)“喜馬拉雅”拿取資源。

怎么用python爬取喜馬拉雅全站音頻


本文分享自微信公眾號(hào) - 自學(xué)的仙叔(gh_3de5e20d92e5)。
如有侵權(quán),請(qǐng)聯(lián)系 support@oschina.cn 刪除。
本文參與“OSC源創(chuàng)計(jì)劃”,歡迎正在閱讀的你也加入,一起分享。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI