python requests 简单网页文本爬取 - 代码天地

python requests 简单网页文本爬取

其他 2018-06-20 19:19:47 阅读次数: 0

爬取网页：

http://www.cnblogs.com/xrq730/archive/2018/06/11/9159586.html

抓取的是一个博客的文本内容

用requeusts获取整个网页的HTML信息；
使用Beautiful Soup解析HTML信息

 1 import requests
 2 from bs4 import BeautifulSoup
 3  
 4 
 5 if __name__=='__main__':
 6     target='http://www.cnblogs.com/xrq730/archive/2018/06/11/9159586.html'
 7     req=requests.get(url=target)
 8     html=req.text
 9     bf=BeautifulSoup(html)
10     texts=bf.find_all('div',class_='blogpost-body')
11     #print(html)
12     print(texts[0].text.replace('<p><span style=\"font-size: 14px; font-family: 宋体;\">','\n\n\t'))
13     #print(texts[0].text.replace('\ax0'*8,'\n\n'))

猜你喜欢

转载自www.cnblogs.com/xy-ju24/p/9204416.html

python requests 简单网页文本爬取

python的requests模块爬取网页内容

python 简单爬取本地文档与爬取网页使用requests和bs4，及自己问题的解决

Python爬虫学习三------requests+BeautifulSoup爬取简单网页

python 爬虫（一） requests+BeautifulSoup 爬取简单网页代码示例

python爬虫——利用requests库BeautifulSoup简单爬取网页上照片—代码完善

python爬虫——利用requests库BeautifulSoup简单爬取网页上照片

Python爬虫学习（一）使用Requests和正则表达式爬取简单网页

python使用requests和BeautifulSoup爬取网页乱码问题

python：Requests+正则爬取网页数据

Python使用requests爬取一个网页并保存

Python 利用Requests库爬取单个网页实例

Python之requests爬取网页数据案例。

python应用学习（五）——requests爬取网页图片

python简单爬取网页文本操作体会

Python requests 爬取qq音乐URL

[python]利用requests爬取成绩

Python爬取数据之Requests库!

【Python requests多页面爬取案例】

python requests 爬取腾讯科技的新闻

python爬虫爬取招聘（ requests，BeautifulSoup）

python获取网页page数，同时按照href批量爬取网页（requests+BeautifulSoup）

Python网页爬虫练习：requests库&Beautiful爬取bilibili网页信息

Python网页解析库：用requests-html爬取网页

python requests的简单使用

python requests 简单示例

python爬取简单网页

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

python爬虫——利用requests库BeautifulSoup定向爬取网页内容写入txt文件

转发：python中的网页爬取函数requests.get（）和urlopen函数的区别

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)