爬虫之抓取哔哩哔哩弹幕 - 代码天地

爬虫之抓取哔哩哔哩弹幕

其他 2018-08-18 11:44:52 阅读次数: 0

抓取面筋哥的视频弹幕，在哔哩哔哩搜索'面筋哥',随便进入一个结果：

视频链接： https://www.bilibili.com/video/av21037939?from=search&seid=1951415484277324635

第一步：找到弹幕的链接

第二步：打开链接:

https://api.bilibili.com/x/v1/dm/list.so?oid=34504767

第三步:撸代码：

# coding: utf-8
from parsel import Selector

import requests


def get(url):
    headers = {
        "Accept": "*/*",
        "Accept-Language": "zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3",
        "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:55.0) Gecko/20100101 Firefox/55.0"
    }
    body = requests.get(url, headers=headers).content
    # 我擦, 居然出现乱码;
    xbody = Selector(text=str(body, encoding='utf-8'))
    lists = xbody.xpath("//d")
    count = xbody.xpath("//maxlimit/text()").extract_first()
    print("共有%s条弹幕" % count)
    for li in lists:
        content = li.xpath("./text()").extract_first()
        par = li.xpath("./@p").extract_first()
        print(content, ":::::", par)


if __name__ == '__main__':
    url = "https://api.bilibili.com/x/v1/dm/list.so?oid=34504767"
    get(url)

结果：

数字的含义，我也不懂就知道一个时间戳和一个用户名；其他的自行查找

猜你喜欢

转载自blog.csdn.net/jianmoumou233/article/details/80692224

爬虫之抓取哔哩哔哩弹幕

爬虫。。。（哔哩哔哩）

Python爬虫之爬取并下载哔哩哔哩视频

【哔哩哔哩】 Python爬虫下载bilibili视频

Python爬虫：哔哩哔哩（bilibili）视频下载

python爬虫轻松提取哔哩哔哩专栏图片

菜鸟弟弟从零开始的爬取Bilibili弹幕的Python爬虫教程-哔哩哔哩 - ( ゜- ゜)つロ干杯~

【爬虫工具】哔哩哔哩插件姬（bilibili-plugin）

scrapy-redis 分布式哔哩哔哩网站用户爬虫

哔哩哔哩热榜爬虫程序及数据处理

bilibili哔哩哔哩B站b站评论爬虫+词云

Python爬虫--爬取哔哩哔哩（B站）短视频平台视频

哔哩哔哩弹幕api查找

Python奇淫技巧之自动登录哔哩哔哩

python 奇淫技巧之自动登录哔哩哔哩

哔哩哔哩助手 for Mac(哔哩哔哩弹幕网辅助扩展插件)

哔哩哔哩小爬虫（爬取某一up主全部投稿视频的相关信息）

程序员笔试之哔哩哔哩2021后端开发编程题收集整理（五）

程序员笔试之哔哩哔哩2021后端开发单选题收集整理（五）

爬取哔哩哔哩弹幕制作词云

爬取哔哩哔哩网站弹幕

哔哩哔哩单个视频弹幕爬取

哔哩哔哩视频弹幕词云分析

swift简单弹幕例子，仿哔哩哔哩

20190910哔哩哔哩

过去，哔哩哔哩上面的视频只能在手机上面下载；现在，我用Python爬虫实现了能在PC端上面下载

在哔哩哔哩学mysql的笔记

哔哩哔哩小程序

模拟登录哔哩哔哩

下载哔哩哔哩视频：

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)