超简单的视频网站爬虫--应用requests - 代码天地

超简单的视频网站爬虫--应用requests

其他 2020-03-31 10:24:49 阅读次数: 0

import requests
import re#正则表达式模块
from urllib.request import urlretrieve   #专门用来下载的方法
import os
#获取网站源代码
def down_loads():
    url = 'https://www.pearvideo.com/category_5'
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363'}
    res = requests.get(url, headers=header).text
#正则表达式、bs4
#通过正则表达式匹配<a href="video_1664559" class="vervideo-lilink actplay" target="_blank">
# .*? 匹配所有
    regex = r'<a href="(.*?)" class="vervideo-lilink actplay">'
    video_id=re.findall(regex,res)#视频id列表
    url2='https://www.pearvideo.com/'
    urllist=[ ]
    for i in video_id:
        newurl=url2+i
        urllist.append(newurl)
    for playurl in urllist:
        html2=requests.get(playurl,headers=header).text
        regex2=r'sdUrl="",ldUrl="",srcUrl="(.*?)",vdoUrl=srcUrl'
        video_id2=re.findall(regex2,html2)
        regex3=r'<h1 class="video-tt">(.*?)</h1>'
        name=re.findall(regex3,html2)
        print('正在下载视频：%s'%name[0])

        path='lishiping'
        if path not in os.listdir():
            os.mkdir(path)
        urlretrieve(video_id2[0], path+"/%s.mp4"%name[0])


down_loads()

现在还只能爬一页视频。。。

Pyouthon

发布了19 篇原创文章 · 获赞 7 · 访问量 874

私信关注

猜你喜欢

转载自blog.csdn.net/Pyouthon/article/details/105160064

超简单的视频网站爬虫--应用requests

Node爬虫抓取视频网站数据

推荐系统在视频网站中的应用

爬虫的基本原理、requests模块、模拟登陆网站、爬取视频网站、cookie池和代理池、正向代理和反向代理

用python爬虫抓取视频网站所有电影

【项目小结】某B视频网站的爬虫实践

提取视频网站

军事视频网站

视频网站的设计

视频网站项目

nosql在视频网站大数据分析的应用

最简单的视频网站（JavaEE+FFmpeg）

简单视频网站源码添加菜单，大秦视频网站源码自定义菜单

视频网站的现状分析

ThinkPHP学习视频网站

视频网站开发

秒搭视频网站

爬虫-主流视频网站（爱奇艺、优酷、腾讯）VIP破解下载

收费视频网站应用场景，什么人适合使用收费视频网站，收费视频点播系统

Python - 下载视频网站的视频

爬取视频网站的视频

下载各视频网站的视频

爬取视频网站视频并下载

【python小项目】网页爬虫+mysql数据库储存，爬虫xx视频网站视频磁力链接

python 网站爬虫（一） requests.get()方法应用

屏蔽优酷、土豆等视频网站15秒广告的最全最简单方法

屏蔽视频网站15秒广告最全最简单de方法

Python爬虫：AcFun弹幕视频网

Python爬虫：ZzzFun动漫视频网

Python每日爬虫案例：爬取梨视频网站，下载完整版小视频并保存本地

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)