bs4和css选择器的基本使用 - 代码天地

bs4和css选择器的基本使用

其他 2020-06-22 17:34:51 阅读次数: 0

import  requests
html=requests.get('url')

soup=BeautifulSoup(html.text,'lxml')

解析器的种类：
html.parser:     python自带，但容错性不够高
lxml:      解析速度快，需额外安装（推荐使用）
xml:       同lxml库,支持xmlx文档
html5lib  :最好的容错性，但速度稍慢

（一）使用Tag对象按照文档结构获取数据
soup.title   #title元素
soup.p     #第一个p
soup.p['class']    #p元素的class属性
soup.p.b   #p元素下的b元素
soup.p.parent.name    #p元素的父节点标签

搜索
（二）find_all 和 find选择器
(1)a=soup.find_all('标签',class_='属性')   #找出所有的
a.text             #获取内容
(2)b=soup.find('标签',class_='属性')        #获取第一个 
b.get_text()    #获取内容
b.text             #获取内容

（三）css选择器
soup.select('title')      #通过标签获取元素
soup.select('.title')     #通过class="title"来获取元素
soup.select('#link2')    #通过id="link2"来获取元素
soup.select('html body p')    #获取html下的body标签下的p标签中内容
soup.select('p,.text')     #同时获取p标签和class="text"

猜你喜欢

转载自www.cnblogs.com/luckiness/p/13177875.html

bs4和css选择器的基本使用

bs4 CSS选择器

beautiful soup 4.0（bs4）使用css选择器搜索文档树（4）

bs4介绍遍历文档树/css选择器

Python学习，还在用正则或者bs4做爬虫吗？来试试css选择器吧

bs4的基本使用方法

Python网络爬虫四大选择器（正则表达式、BS4、Xpath、CSS）总结

bs4的使用

bs4使用

css基本使用--css选择器

css高级选择器和基本选择器

bs4的基本语法

Python 爬虫 bs4 数据解析基本使用

Python之xpath、JsonPath、bs4基本使用

Bs4 简单使用

css基础-html中使用css、基本选择器、类选择器、id选择器、通用选择器、符合选择器、css权重

css基本选择器

CSS 基本选择器

CSS——基本选择器

正则、xpath、bs4 的基本用法

CSS的基本选择器和CSS扩展选择器

CSS基础语法、基本选择器、元素选择器、类选择器、ID选择器、伪类和伪元素选择器

BS4库的解析器！

02-CSS简介和基本选择器

03-CSS基本样式和选择器

Web-CSS-概述，基本语法和选择器

CSS的四种基本选择器和四种高级选择器

一文学会CSS基本选择器和复合选择器

bs4使用方法

bs4使用lxml报错

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)