入门级用Python写一个简单的网络爬虫下载和获取数据 - 代码天地

入门级用Python写一个简单的网络爬虫下载和获取数据

其他 2018-09-09 20:08:54 阅读次数: 0

学会如何使用API
通过url(Uniform Resource Locator 统一资源定位符)连接网络,获取网站的API
获取url存储的API，request执行获取的url
requests.get(url)
定义一个变量，将API响应存储在里面，调用json将r存储的api转换成字典
rd = r.json()

如何在网站上下载文件
可以调用这个方法urllib.request.urlopen("http://placekitten.com/g/800/800")，打开网站，将这个api存放在一个变量response里
再定义一个变量file_img 调用response.read()来读取那个网站的信息，储存到file_img
调用with open('cat_800_800.jpg','wb') as f:
f.write(cat_img)
写入这个文件
查看网站信息，可以打印api存放的变量，出现网站连接，也可以用这样的方法a = response.geturl() print(a)

以下是完整代码
import urllib.request

response = urllib.request.urlopen("http://placekitten.com/g/800/800") //后面的800/800是可以修改的，不同的数值下载的内容就不一样
cat_img = response.read()
print(response)
with open('cat_800_800.jpg','wb') as f:
f.write(cat_img)
a = response.geturl()
print(a)
这里会下载一个小猫的图片

下面是利用爬虫访问获取网站，浏览网站的信息
这里的Demo用的是有道翻译的数据
import urllib.request
import urllib.parse

url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc'
'''可以在浏览器上右击查看的源代码'''
data = {
"type": "AUTO",
"i": "sentence", //这里可以输入你想翻译的字符串
"doctype": "json",
"xmlVersion": "2.1",
"keyfrom": "fanyi.web",
"ue": "UTF-8",
"action": "FY_BY_CLICKBUTTON",
"typoResult": "true"
} #这些参数要设对了

data = urllib.parse.urlencode(data).encode('utf-8') #把Unicode形式转换成utf-8

response = urllib.request.urlopen(url,data)
html = response.read().decode('utf-8') #转码将utf-8解码成unicode的形式

print(html) #打印出json结构的数据

猜你喜欢

转载自blog.csdn.net/qq_37504771/article/details/80502283

入门级用Python写一个简单的网络爬虫下载和获取数据

用webmagic写一个简单的网络爬虫

初次用python写一个简单爬虫-获取电影天堂电影列表

用python写一个最简单的网络爬虫，豆瓣250

《用python写网络爬虫》编写第一个网络爬虫

《用Python写爬虫》学习笔记（二）编写第一个网络爬虫

sprongboot+vue3写一个入门级错题本

随手用python写一个下载源码爬虫试试

Python快速入门到实战（六）用Python写一个简易爬虫

用JAVA写一个超级简单的爬虫例子

如何开始写你的第一个python脚本——简单爬虫入门！

用Python写一个带进度条的简单下载器

一个不错的shell 脚本教程入门级

一个入门级的IT码农的自述

Daily，一个入门级的 React Native 应用

影像组学——一个入门级汇报

我的第一个用python写的爬虫

用Python写一个小爬虫吧！

一天时间入门python爬虫，直接写一个爬虫案例，分享出来，很简单

Python的类和对象入门级讲解（简单粗暴）

用java实现一个简单的网络爬虫

Python怎样写一个简单的爬虫

用python写一个简单的BP神经网络

Python入门 —— 用pycharm写一个简单的小程序3

最简单的入门级的一个使用hibernate框架的例子。（包含了处理插入数据库中文乱码问题）

用Java写一个爬虫

用python实现的一个简单的爬虫

用python做一个简单的游戏,用python写一个小游戏

用python写一个简单计算器

用Python写一个简单的表白

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)