Python3 多线程爬取梨视频

其他 2019-10-25 02:17:30 阅读次数: 0

多线程爬取梨视频

from threading import Thread
import requests
import re


# 访问链接
def access_page(url):
    response = requests.get(url)
    return response


# 获取主页视频的id列表, 用来拼接视频详情页链接
def get_video_id(homepage_data):
    id_list = re.findall('<a href="video_(.*?)" .*?>', homepage_data, re.S)
    return id_list


# 获取视频链接列表
def get_video_url(detail_page_data):
    video_url = re.findall('srcUrl="(.*?)"', detail_page_data, re.S)[0]
    return video_url


# 获取视频名称
def get_video_name(detail_page_date):
    video_name = re.findall('<h1 class="video-tt">(.*?)</h1>', detail_page_date, re.S)[0]
    return video_name


# 保存视频
def save(video_data, name):
    with open(f'{name}.mp4', 'wb') as f:
        f.write(video_data)
        print(f'视频[{name}]下载成功!')


def run(id):
    # 拼接详情页链接并访问
    detail_page_url = 'https://www.pearvideo.com/video_' + id
    detail_page_data = access_page(detail_page_url).text
    # 获取视频名称和视频链接
    video_name = get_video_name(detail_page_data)
    video_url = get_video_url(detail_page_data)
    # 访问视频链接获取视频数据
    video_data = access_page(video_url).content
    # 保存视频数据
    save(video_data, video_name)


if __name__ == '__main__':

    homepage_data = access_page('https://www.pearvideo.com/').text
    id_list = get_video_id(homepage_data)

    # 多线程爬取
    for id in id_list:
        t = Thread(target=run, args=(id,))
        t.start()

猜你喜欢

转载自www.cnblogs.com/bigb/p/11735900.html

Python3 多线程爬取梨视频

python的多线程异步爬取梨视频(原创）

python爬虫实践——爬取“梨视频”

python之梨视频网站视频爬取及下载

python爬取小视频——梨视频

Python3多线程爬取妹子图的图片

python基础day3-爬取梨视频,2019-6-25

python3爬虫系列16之多线程爬取汽车之家批量下载图片

【Python3 爬虫】U28_多线程爬取斗图啦的表情包

Python3，多线程爬取某瓣小电影~ ~

【python3】爬取百度图片，多线程爬取，自动局部刷新与翻页

Python3 多线程

Python3多线程

Python3，多线程爬完B站UP主的视频弹幕及评论，我飘了~ ~ ~

爬取梨视频

Python3腾讯视频评论爬取

Python3爬取爱奇艺VIP视频

Python3爬虫爬取VIP视频

Python-爬取校花网视频(单线程和多线程版本)

python3 线程

Python每日爬虫案例：爬取梨视频网站，下载完整版小视频并保存本地

python3爬取网页图片

Python3——爬取淘宝评论

python3爬取图片

python3爬取租房的信息

python3 爬取影像数据

python3 爬取API数据

使用Python3爬取美女

使用python3爬取小说

Python3爬取音乐

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)