溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python爬取m3u8連接的視頻

發(fā)布時(shí)間:2020-09-23 08:44:58 來源:腳本之家 閱讀:124 作者:lingluofengzang 欄目:開發(fā)技術(shù)

本文為大家分享了python爬取m3u8連接的視頻方法,供大家參考,具體內(nèi)容如下

要求:輸入m3u8所在url,且ts視頻與其在同一路徑下

#!/usr/bin/env/python
#_*_coding:utf-8_*_
#Data:17-10-08
#Auther:蘇莫
#Link:http://blog.csdn.net/lingluofengzang
#PythonVersion:python2.7
#filename:download_movie.py

import os
import sys
import requests

reload(sys)
sys.setdefaultencoding('utf-8')

# 功能:爬取m3u8格式的視頻

# 檢查存儲(chǔ)路徑是否正常
def check_path(_path):
  # 判斷存儲(chǔ)路徑是否存在
  if os.path.isdir(_path) or os.path.isabs(_path):
    # 判斷存儲(chǔ)路徑是否為空
    if not os.listdir(_path):
      return _path

    else:

      print u'>>>[-] 目標(biāo)文件不為空,將清空目標(biāo)文件,是否更換路徑?'
      flag = raw_input('>>>[*] Yes:1 No:2 \n>>>[+] [2]')

      try:
        if flag == '1':
          _path = raw_input(unicode('>>>[+] 請(qǐng)輸入目標(biāo)文件路徑。\n>>>[+] ').encode('gbk'))
          check_path(_path)
        else:
          # 清空存儲(chǔ)路徑
          os.system('rd /S /Q ' + _path)
          os.system('mkdir ' + _path)
          return _path
      except Exception as e:
        print e
        exit(0)

  else:
    os.makedirs(_path)
    return _path

# 獲取ts視頻的爬取位置
def get_url(_url, _path):

  all_url = _url.split('/')
  url_pre = '/'.join(all_url[:-1]) + '/'
  url_next = all_url[-1]

  os.chdir(_path)
  # 獲取m3u8文件
  m3u8_txt = requests.get(_url, headers = {'Connection':'close'})
  with open(url_next, 'wb') as m3u8_content:
    m3u8_content.write(m3u8_txt.content)
  # 提取ts視頻的url
  movies_url = []
  _urls = open(url_next, 'rb')
  for line in _urls.readlines():
    if '.ts' in line:
      movies_url.append(url_pre + line[:-1])
    else:
      continue

  _urls.close()
  return movies_url

# 爬取ts視頻
def download_movie(movie_url, _path):
  os.chdir(_path)
  print '>>>[+] downloading...'
  print '-' * 60
  error_get = []

  for _url in movie_url:
    # ts視頻的名稱
    movie_name = _url.split('/')[-1][-6:]

    try:
      # 'Connection':'close' 防止請(qǐng)求端口占用
      # timeout=30  防止請(qǐng)求時(shí)間超長(zhǎng)連接
      movie = requests.get(_url, headers = {'Connection':'close'}, timeout=60)
      with open(movie_name, 'wb') as movie_content:
        movie_content.writelines(movie)
      print '>>>[+] File ' + movie_name + ' done'
    # 捕獲異常,記錄失敗請(qǐng)求
    except:
      error_get.append(_url)
      continue
  # 如果沒有不成功的請(qǐng)求就結(jié)束
  if error_get:
    print u'共有%d個(gè)請(qǐng)求失敗' % len(file_list)
    print '-' * 60
    download_movie(error_get, _path)
  else:
    print '>>>[+] Download successfully!!!'

if __name__ == '__main__':
  try:

    _url = raw_input(unicode('>>>[+] 請(qǐng)輸入指定的[.m3u8]目標(biāo)URL。\n>>>[+] ').encode('gbk'))
    _path = raw_input(unicode('>>>[+] 請(qǐng)輸入存儲(chǔ)目標(biāo)文件路徑。\n>>>[+] ').encode('gbk'))

    storage_path = check_path(_path)
    movie_url = get_url(_url, storage_path)
    download_movie(movie_url, storage_path)

  except Exception as e:
    print e

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI