Python——获取网页文本内容 - 代码天地

Python——获取网页文本内容

其他 2020-05-21 13:58:24 阅读次数: 0

01 实现背景

1、免费小说网站：http://book.zongheng.com/，我们获取的文字信息就来源于该网站

2、requests模块，用于http形式请求访问网页

3、BeautifulSoup模块，用于解析获取到的网页内容

02 实现目标

首先利用requests模块获取网页源码，通过BeautifulSoup模块进一步筛选获得文本内容

03 注意事项

如需将获取内容输入到本地文件，可自行利用with…open操作

04 实现代码

import requests 
from bs4 import BeautifulSoup

url = 'http://book.zongheng.com/chapter/897468/58575172.html'
resp = requests.get(url = url)
html = resp.text
soup = BeautifulSoup(html,"html.parser")
try:
	for i in  range(50):
		print(soup.find_all('p')[i].string)
except:
	pass

05 实现效果

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq2539879928/article/details/106176843

Python——获取网页文本内容

python获取网页内容

python 获取网页的内容

爬虫基础：python获取网页内容

python网页全部内容的获取

python使用requests库获取网页的内容

python和shell获取文本内容

获取网页内容WebClient

获取文本/日志内容

Python 获取网页标签中的全部文本的几种方法

Python获取网页指定内容(BeautifulSoup工具的使用方法)

Python爬虫requests添加头部和代理获取网页内容

python3 使用requests获取网页内容

python 爬虫获取网页 html 内容以及下载附件的方法

Python爬虫：lxml模块分析并获取网页内容

python3获取一个网页特定内容

python快速获取网页标准表格内容

Python-获取CSDN网页内容并输出为pdf

python：TKinter获取Text文本框的输入内容

JS-将文本框获取的内容显示在网页上

获取网页内文本信息

网页内容获取工具 HttpClient

网页内容获取工具 jsoup

网页内容获取工具 URLConnection

C++获取网页内容

关于java获取网页内容

C# 获取网页内容

如何获取URL网页内容

php curl获取网页内容

xpath解析网页，xpath获取网页的内容

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)