抓取b站今日热门

其他 2019-09-15 16:31:14 阅读次数: 0

一、抓取标题和视频地址并下载

二、思路

　　1.打开目标地址：http://vc.bilibili.com/p/eden/rank#/?tab=%E5%85%A8%E9%83%A8

　　2.按f12

　　3.点network查找相应url如图

　　4.开始写代码：

import requests
import json,time

headers = {
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
    }
def get_json(url,i):

    data = {
        'page_size': '10',
        'next_offset':str(i) ,
        'tag': '今日热门',
        'platform': 'pc',
    }
    html = requests.get(url,params=data,headers=headers).text
    return html

def dowm_mv(url,title):
    start = time.time()  # 开始时间
    size = 0
    response = requests.get(url, headers=headers, stream=True)  # stream属性必须带上
    chunk_size = 1024  # 每次下载的数据大小
    content_size = int(response.headers['content-length'])  # 总大小
    if response.status_code == 200:
        print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024))  # 换算单位
        with open(title, 'wb') as file:
            for data in response.iter_content(chunk_size=chunk_size):
                file.write(data)
                size += len(data)  # 已下载的文件大小

if __name__ == '__main__':
    for i in range(0,9):
        num = i * 10 + 1
        url = 'http://api.vc.bilibili.com/board/v1/ranking/top?'
        html_json = get_json(url,num)
        html_json = json.loads(html_json)
        print(html_json)
        infos = html_json['data']['items']
        for info in infos:
            title = info['item']['description']
            mv = info['item']['video_playurl']
            print(title,mv)
            try:
                dowm_mv(mv,title = '%s.mp4'%title)
            except Exception as e:
                print('下载失败')

　　5.抓取结果如下

猜你喜欢

转载自www.cnblogs.com/a595452248/p/11523205.html

抓取b站今日热门

B 站今日黑白页是怎么实现的？

抓取B站小视频

B站视频之CC字幕抓取

爬取B站热门视频排行榜

【python爬虫】抓取B站视频相关信息（一）

抓取B站所有用户信息

python爬取B站千万级数据，发现了这些热门UP主的秘密！

爬取b站所有的热门视频并且存入mongodb数据库

Python 爬取b站热门视频信息并导入Excel表格

B站2020年每周必看热门视频数据盘点！Python数据分析

爬取b站热门视频的弹幕，并进行弹幕分析

B站电商分析，如何发现近期热门商品及优质视频带货达人？

抓取CSDN博客热门文章

【python爬虫】抓取B站视频数据及相关信息（二）

抓取b站视频信息存入excel表格 + 存进mysql （已修改）

3行！仅3行代码就能抓取B站数据

Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy

Python爬虫案例50篇-第9篇- 抓取B站迪迦奥特曼评论到Excel

笔记-抓取今日头条图片

抓取今日头条文章

今日头条街拍图片抓取

抓取今日头条街拍美图

今日头条案例抓取

Ajax数据抓取及抓取今日头条上的图片

b站弹幕

B站与知乎

b站封面提取

B站视频下载

B站视频爬虫

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)