python获取网页内容 - 代码天地

python获取网页内容

其他 2018-07-27 21:37:17 阅读次数: 0

需要用到bs4套件来获取网页中的文本，如果没有添加此套件，可以根据以下操作来添加win+r，输入cmd，输入pip install BeautifulSoup4，因为我已经安装过了所以出现以下内容

　　安装完成后即可开始编写代码

代码如下

 1 import requests
 2 #导入bs4套件
 3 from bs4 import BeautifulSoup
 4 newsurl = 'http://www.163.com/'
 5 #发送get请求
 6 res = requests.get(newsurl)
 7 #设置网页编码格式，如果不设置的话会产生中文乱码，编码格式按照爬取得网页来设置
 8 res.encoding='gbk'
 9 #将网页放入BeautifulSoup中，获取网页中的文本内容，把html标签都除掉，html.parser为剖析器，如果不自己设置系统会自动分配一个剖析器
10 soup = BeautifulSoup(res.text,"html.parser")
11 print(res.text)

猜你喜欢

转载自blog.csdn.net/qq_36750461/article/details/81200021

python获取网页内容

python 获取网页的内容

Python——获取网页文本内容

爬虫基础：python获取网页内容

python网页全部内容的获取

python使用requests库获取网页的内容

获取网页内容WebClient

Python获取网页指定内容(BeautifulSoup工具的使用方法)

Python爬虫requests添加头部和代理获取网页内容

python3 使用requests获取网页内容

python 爬虫获取网页 html 内容以及下载附件的方法

Python爬虫：lxml模块分析并获取网页内容

python3获取一个网页特定内容

python快速获取网页标准表格内容

Python-获取CSDN网页内容并输出为pdf

网页内容获取工具 HttpClient

网页内容获取工具 jsoup

网页内容获取工具 URLConnection

C++获取网页内容

关于java获取网页内容

C# 获取网页内容

如何获取URL网页内容

php curl获取网页内容

xpath解析网页，xpath获取网页的内容

Python抓取网页内容

Python编程学习之利用selenium分辨出可访问的网页并获取网页内容

Python获取网页编码

Python爬取网页内容

python解析omim网页内容

获取网页内容生成html，并将某些标签属性进行修改 (基于python3.6)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)