爬虫学习笔记（一）---获取页面、图片、百度翻译 - 代码天地

爬虫学习笔记（一）---获取页面、图片、百度翻译

编程语言 2019-04-04 10:40:54 阅读次数: 0

获取百度页面
1，确定url
2，打开url
3，返回一个html 16进制
4，转化为utf8
5，存入本地

import urllib.request
url = "http://www.baidu.com"
response = urllib.request.urlopen(url)
data = response.read()
#data数据本来为bytes类型数据，需要转换为str数据
html = data.decode("utf8")
#将html数据存入到文件中
with open("baidu.html","w",encoding="utf8") as f :
    f.write(html)

获取百度的图片

获取百度翻译

1，找到json
2，找到url
3，找到接口，请求方式

F12>>左上角屏蔽键>>点击一下翻译>>找到json数据

在这里插入图片描述找到url

找到传入参数（data）
在这里插入图片描述
确定json格式，用在线json工具

在这里插入图片描述确定hero位置

伪装爬虫身份
寻找User-Agent:
在这里插入图片描述 1，在创建request对象的时候，填入headers参数（包含User Agent信息），这个Headers参数要求为字典；
2，在创建Request对象的时候不添加headers参数，在创建完成之后，使用add_header()的方法，添加headers。

猜你喜欢

转载自blog.csdn.net/qq_32166779/article/details/85015792

爬虫学习笔记（一）---获取页面、图片、百度翻译

爬虫（一）百度翻译

【学习笔记】python3 爬虫-百度图片

最新百度翻译爬虫获取sign（python爬虫）

爬虫基本的get获取和post百度翻译

爬虫学习之9：结合百度翻译API爬取PEXELS网站图片

python爬虫学习（三）百度翻译

百度图片爬虫

爬虫 -- 百度图片

python爬虫百度翻译

爬虫实现百度翻译

爬虫JS渗透百度翻译

通过爬虫使用百度翻译

反爬虫破解——百度翻译

Python爬虫学习笔记二：百度贴吧网页图片抓取

学习笔记（爬虫）：爬取百度贴吧，美女吧图片

爬虫（一）抓取百度页面的内容

post请求获取百度翻译

调用百度API(一)——百度翻译

python爬虫学习京东页面、亚马逊访问|、百度搜索、网上爬取图片 DAY2

基于Tkinter以及百度翻译爬虫做的一个小的翻译软件

python 百度图片爬虫

python爬虫(百度图片)

爬虫_百度图片下载

百度图片爬虫教程

Python——百度图片爬虫

爬虫_百度贴吧图片

爬虫——百度图片爬取

前段学习笔记----制作一个静态百度首页页面

实现百度图片搜索页面

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)