soup.find_all()函数的重复问题 - 代码天地

soup.find_all()函数的重复问题

其他 2018-11-24 20:34:43 阅读次数: 0

前一个月接触了python并且跟着视频和书籍学习了python的语法。最近在观摩Python的爬虫操作。学习了一点requests,bs4库的用法。

于是自己也动手实验了一下初级的网页代码爬取。

先上一个自己写的标准套路样式的代码吧：

这段代码是先用requests库提取b站的所有代码，然后用bs4库使提取的标签代码变得更整齐，然后创建一个列表，用beaytifulsoup中的find_all()函数加上for循环履遍所有‘div’标签，如果标签中不为空值，则存入列表中。最后打印列表。但是输出结果却并不如人意：

如上图所示，截取的‘div’标签中的内容被重复录入了三次（我一开始以为是输出了两次，但是我直接输出列表中的内容却还是重复三次）。

百度搜过了soup,find_all()函数后，我看到了另一种写法，把它运用在我的代码中如下：

上图红线是改进后代码的不同之处。在find_all（）函数中添加了标签参数，存入sopus中，再循环将标签内容送入列表，此时列表中有完整的标签，形如<div>string<div>格式，所以最后将列表内容输出时要加.text输出标签里的string。

输出效果如下图:

但是，我还是不知道为什么第一次的那一种方法会连续重复存入三次。在日后的学习中，我或许会明白的。

猜你喜欢

转载自blog.csdn.net/a13697013326/article/details/83388327

soup.find_all()函数的重复问题

soup之find

Python-bs4库，find_all 函数处理css样式问题

BeautifulSoup库之find_all函数

[Python]find_all函数 2020.2.7

python爬虫日志(5)find(),find_all()函数

python爬虫学习笔记（一）-- Python函数五种参数类型+soup.find()函数使用

【Python】AttributeError: ‘NoneType‘ object has no attribute ‘find_all‘错误以及find_all函数

Beautiful Soup 的使用问题

(Java) LeetCode 442. Find All Duplicates in an Array —— 数组中重复的数据

Leetcode#442. Find All Duplicates in an nums（数组中重复的数据）

【LeetCode】442. Find All Duplicates in an Array 找出数组中所有重复项

[Swift]LeetCode442. 数组中重复的数据 | Find All Duplicates in an Array

Find All Duplicates in an Array

Find All Anagrams in a String

all函数

万门cpp作业：写模板函数实现find_all和sort排序

BeautifulSoup find() 和 find_all()

BeautifulSoup中find，find_all

find()和find_all()的具体使用

Find All Numbers Disappeared in an Array

leetcode:Find All Duplicates in an Array

leetcode Find All Anagrams in a String

【CODE】Find All Duplicates in an Array

滑动窗口问题——固定窗口长度长度 leetcode438. Find All Anagrams in a String

解决vscode C++代码查找所有引用“Find all reference“慢的问题

Promise.all解决嵌套使用回调函数问题

any()函数与all()函数

all()函数与any()函数

find函数

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

《Python 编程-从入门到实践》11-1~11-3

关于Numpy+TensorFlow+PyTorch构造NN的总结

【原创达人】制作WINPE启动盘心得

英文图片文字识别（提取）

2022cma看片网站给一个你懂的

二叉搜索树的实现（BST）（插入+删除+查找+各种遍历+高度）

搬家通知博文地址(将博客搬到CSDN)

asfd

解决错误：MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk

如何注册微信个人小程序

每日归档

更多

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)