对于简单爬虫的补充（汉字转码） - 代码天地

对于简单爬虫的补充（汉字转码）

其他 2019-04-27 21:31:14 阅读次数: 0

在上一篇提到，接口地址可能有许多参数，但是如果我们将c或者python换成汉字会怎样？

这个时候直接拼接url方法将不适用，所以我们引入字典作为参数

para_dic = {
"kw":"还珠格格",
'pn':0
}

进行抓取数据

url = "http://tieba.baidu.com/f"

response = requests.get(url,params=para_dic)

print(url)

print(response)

这里有两个小知识点

在爬取某些网站时候，可能会遇到编码的问题，我们请求时用到的是utf-8编码

而此时的编码不符合网站的编码，所以可以使用response.encoding来获取网页

界面的编码

响应头部的字符编码

print(response.encoding) #指的是网页上编码

查看响应状态码

print(response.status_code)

猜你喜欢

转载自blog.csdn.net/weixin_44303465/article/details/89566632

对于简单爬虫的补充（汉字转码）

汉字乱码转码

汉字转码工具

Python爬虫_乱码、转码

json_encode汉字转码，符号转码，/ 问题

HttpClient post提交数据，汉字转码

idea取消属性文件汉字自动转码

编码转码的简单记录

FFmpeg 简单实现转码

对于Java中多态的补充

scrapy补充-异步爬虫

Python爬虫汉字乱码问题

爬虫url 汉字处理

对于wkwebview网页高度计算的补充/网页高度计算的另一种简单方法

对于网上简单爬虫爬取网站图片实例的操作体会

python网络爬虫之中文转码

java 对于表情和特殊字符的转码解码处理

对于面试此类问题回答（待补充）

对于opencv+contrib配置的补充说明

对于SQL的一些补充

对于请求wsdl的webService地址补充

对于gets()的知识点补充

对于ajax的简单理解

对于Http的简单理解

对于MVC的简单理解

对于Cron简单的认识

对于Maven的简单理解

转码

爬虫性能相关解释、补充

grpc 简单实例补充

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)