梨の基礎day3-ビデオ、2019年6月25日をクロールパイソン

「」「」「」
「「」
:ビデオオプションを
1.ビデオナシ
「」」
#インポート要求の
#の
映像送信要求の送信元アドレスには##を
#1 requests.getレスポンス=(
#「https://video.pearvideo.com/ MP4 / adshort / 20190625 / 1570302-14057031_adpkg-ad_hd.mp4-CONT ')

などの画像、ビデオ、データなどの##のプリントバイナリストリーム、
#印刷(response.content)

##ローカルに保存された映像
(オープンと#'ビデオ'F AS):.MP4 '' WB
#のf.write(response.content)

' ''
最初のホームビデオ梨にリクエストを送信し、1を
https://www.pearvideo.com/

ビデオのすべてがIDを取得解決:
video_1570302

re.findall()


2、ビデオの詳細ページのURLを取得するために:
!地下鉄に奪わスリルの男がに徒歩で滑っ
//www.pearvideo:httpsを。COM / video_1570302
シークレットカレーズ
https://www.pearvideo.com/video_1570107
「」「
のインポートが要求
輸入のRe#の定期を、テキストデータの解析のための
ビデオのホームピアーズに#1、第1の送信要求を
応答= requests.get(」HTTPS://www.pearvideo .COM / ')
プリント(response.text)

通常のビデオマッチングアクセサリーIDの再#
#パラメータ1:定期的なマッチングルール
#2パラメータ:テキスト解析
、パターンマッチング:#3パラメータ
res_list = re.findall(' <HREFを = "(。*?)ビデオ_" 'response.text、re.S)
印刷(res_list)

は、各動画の詳細ページのURLをステッチ
res_listでv_idのために:
detail_url =' https://www.pearvideo.com/video_ 「+ v_id
#印刷(detail_url)

は、ビデオソースのURLの前に、ビデオの各ページのリクエストを送信
レスポンス= requests.get(URL = detail_url)
印刷(response.text)

のパースと動画のURLの前にページを抽出
#ビデオのURL
= re.findall video_url( 'srcUrl = "(。*?)"'、response.text、re.S)[0]
印刷(video_url)

ビデオ名
VIDEO_NAME = re.findall(
「<H1 CLASS =「ビデオ- TT「>(。*?)</>」のH1、response.text、re.S)[0]

印刷(VIDEO_NAME)

バイナリのビデオストリームを取得するには#のURL映像送信要求
v_response = requests.get(video_url)を

オープンして( 's.mp4%' %VIDEO_NAME、F AS 'WB'):
f.write(v_response.content)
印刷(VIDEO_NAME、 'ビデオは完全にクロール')


おすすめ

転載: www.cnblogs.com/leyzzz/p/11094291.html