Python爬虫进阶——Request对象之post请求案例分析【百度翻译】 - 代码天地

Python爬虫进阶——Request对象之post请求案例分析【百度翻译】

其他 2019-12-25 10:34:17 阅读次数: 0

作为进阶的最后一篇，我们就讲个有意思点的案例吧——百度翻译。

一、分析URL接口

正如上一篇：《Python爬虫进阶——Get请求》讲到的：当我们进行爬虫开发的时候，首先要做的，就是分析URL接口。

打开百度翻译;
F12;
开发者工具中点击“暂停”和“清空”；
输入“python”，并选中如图的“sug”请求；
点击“Headers”，可以查看到图中圆圈中的信息；

二、代码实现

baidu_fanyi.py

import urllib.request as ur
import urllib.parse as up

# 实例化data
data = {
    'kw': 'python'
}
# data编码
data_url = up.urlencode(data)

request = ur.Request(
    url='https://fanyi.baidu.com/sug',
    # 不仅仅url编码，还需encode转成字节
    data=data_url.encode('utf-8'),
)

response = ur.urlopen(request).read()
print(response)

输出如下：

在这里插入图片描述
注意：
输出结果为字节类型，为json对象，还需使用loads方法。

三、代码抽离和完善

import urllib.request as ur
import urllib.parse as up
import json

word = input('请输入要翻译的英文：')
# 实例化data
data = {
    'kw': word
}
# data编码
data_url = up.urlencode(data)

request = ur.Request(
    url='https://fanyi.baidu.com/sug',
    # 不仅仅url编码，还需encode转成字节
    data=data_url.encode('utf-8'),
)

response = ur.urlopen(request).read()
# print(response)

ret = json.loads(response)
# print(ret)
translate = ret['data'][0]['v']
print(translate)

输出如下：

在这里插入图片描述
OK啦~~
简直完美。
天色已晚，明天再写《Python爬虫实战篇》吧。

为我心爱的女孩~~

猜你喜欢

转载自www.cnblogs.com/WoLykos/p/12095204.html

Python爬虫进阶——Request对象之post请求案例分析【百度翻译】

python 爬虫（二）requests模块的介绍 + 基于requests模块的get请求和post请求 + 相关爬取案例（百度贴吧 + 百度产品 + 有道翻译 + 百度翻译）

post请求获取百度翻译

Python基础爬虫之百度翻译

python爬虫百度翻译

爬虫基本的get获取和post百度翻译

Python爬虫教程-07-post介绍百度翻译（上）

爬虫018_urllib库_cookie反爬_post请求百度翻译获取百分翻译内容_以及详细翻译内容---python工作笔记037

最新百度翻译爬虫获取sign（python爬虫）

Python爬虫实战，简单的爬虫案例，以及爬取百度贴吧网页原码和360翻译

电脑版百度翻译接口python爬虫

【Python】百度翻译的爬虫实现（前篇）

【Python】百度翻译的爬虫实现（后篇）

Python爬虫【实战篇】百度翻译

用Python爬虫调用百度翻译

python --爬虫--爬取百度翻译

Python爬虫教程-实现百度翻译

python爬虫学习（三）百度翻译

Python爬虫实现百度翻译功能过程详解

js逆向实战 -- python实现百度翻译案例

Python 大规模异步新闻爬虫、google翻译、百度翻译、有道翻译、百度指数

Python爬虫案例50篇-第21篇-百度翻译js加密(加密参数sign)

Python爬虫进阶——Request对象之Get请求与URL编码【英雄联盟吧】

Python学习之爬虫03-自动模拟HTTP请求与百度信息自动搜索

Python爬虫案例：爬取百度图片

爬虫实现百度翻译

爬虫（一）百度翻译

爬虫JS渗透百度翻译

通过爬虫使用百度翻译

反爬虫破解——百度翻译

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)