Python爬虫 - 获取网页编码

其他 2020-01-20 11:19:31 阅读次数: 0

前言：在我们做爬虫的时候会发现不同的网页会有不同的编码方式，但我们需要根据编码方式来获取数据，所以我们要先获取编码方式，为此我使用requests库解析当前页的编码方式。

requests库是常用的网页解析库，也是我做爬虫时一直使用的库。其中的apparent_encoding方法可以正确获取当前网页的编码方式。

import requests
url = 'https://www.baidu.com/'
html = requests.get(url)
print(html.apparent_encoding)

在这里插入图片描述

欢迎关注同名微信公众号：程序猿杂记

程序猿杂记

技术|交流|福利

程序猿杂记

发布了63 篇原创文章 · 获赞 87 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_44110998/article/details/103902304

Python爬虫 - 获取网页编码

Python获取网页编码

python 获取网页编码问题

关于爬虫中获取目标网页编码、解码信息

Python爬虫获取网页编码为“ISO-8859-1”，中文乱码

Python获取网页编码的两种方法——requests、chardet

爬虫基础：python获取网页内容

python爬虫基础--获取并解析网页

python 爬虫 selenuim获取动态网页

python爬虫获取网页源代码

Python爬虫——利用爬虫从网页获取视频资源

Python 爬虫网页

Python 网页爬虫

python网页爬虫

Python 简单网页爬虫

python 爬虫网页信息

Python网页爬虫代码

Python判断网页编码

[笔记]python爬虫学习笔记（一）——网页的获取和打印

Python爬虫requests添加头部和代理获取网页内容

Python爬虫1-获取指定网页源码

python 爬虫获取网页 html 内容以及下载附件的方法

Python爬虫：lxml模块分析并获取网页内容

Python爬虫 | 打开网页获取原码的几种方式

【python爬虫】黑科技之pandas获取网页表格数据

python爬虫获取图片

python爬虫.1.简单的网页爬虫

python 爬虫应对网页反爬虫的设置

python3如何获取网页中使用了base64编码的图片

python爬取网页的方法总结,python爬虫获取网页数据

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)