bilibili视频-爬虫 - 代码天地

bilibili视频-爬虫

其他 2020-02-08 21:34:07 阅读次数: 0

1

import requests
url = "https://item.jd.com/2967929.html"
try:
    r = requests.get(url)
    r.raise_for_status()   ##
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取出错")

ip地址查询

url = "http://m.ip138.com/ip.asp?ip="
try:
    r = requests.get(url + "202.204.80.112")
    r.raise_for_status()   ##
    r.encoding = r.apparent_encoding
    print(r.text[-500:])  ##防止文本过大导致卡机
except:
    print("爬取失败")

beautifulsoup

from bs4  import BeautifulSoup
import requests
r = requests.get("http://python123.io/ws/demo.html")
r.text
demo = r.text
soup = BeautifulSoup(demo, "html.parser")
#soup = BeautifulSoup(open("d://demo.html"), "html.parser")

print(soup.prettify())  ##格式化打印

基本元素

标签使用

soup.a.name 
tag = soup.a
tag.attrs
tag.attrs['class']
tag.attrs['href']

标签树上行遍历

for  parent in soup.a.parents:
    if parent is None:
        print(parent)
    else: 
        print(parent.name)

猜你喜欢

转载自www.cnblogs.com/g2thend/p/12285118.html

bilibili视频爬虫

bilibili视频-爬虫

爬虫 - bilibili排行榜视频

bilibili爬虫

Python爬虫【实战篇】bilibili视频弹幕提取

Python爬虫：爬取Bilibili视频(.m4s)

【哔哩哔哩】 Python爬虫下载bilibili视频

Python爬虫：哔哩哔哩（bilibili）视频下载

bilibili网站爬虫

从bilibili引用视频

python 下载bilibili视频

Mac下载Bilibili视频

BiliBili视频下载

爬取 bilibili 视频（bilibili干杯）

使用爬虫爬取bilibili播放量过10w的视频

分布式爬虫——爬取bilibili视频信息资源

【Python爬虫实例学习篇】——4、超详细爬取bilibili视频

【python实现网络爬虫（15）】python使用you-get爬取bilibili网站视频

从bilibili下载视频，取其音频

python网络爬虫（爬取bilibili一位up的视频标题，评论数量等基本信息）

Python爬虫之bilibili视频弹幕爬取并保存为JSON格式（详解分析+代码实现）

pychong爬虫爬取bilibili弹幕数据

Python爬虫下载Bilibili番剧弹幕

分布式爬虫-bilibili评论

爬虫获取 bilibili 弹幕并生成词云

Bilibili-B站python爬虫

bilibili

python 爬取bilibili 视频信息

使用 youget 在电脑上下载bilibili的视频

Python爬取bilibili视频(期末设计)

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)