python爬虫之异步IO - 代码天地

python爬虫之异步IO

其他 2019-03-16 07:10:57 阅读次数: 0

在web请求非常多的情况下，异步IO往往效果和速率惊人。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests,time
start_time=time.time()
resp=requests.get(url='http://httpbin.org/headers')
print(resp.text)
print('用时：%s秒'%(time.time()-start_time))

运行结果：

然后用aiohttp和asyncio进行异步IO试一下：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import asyncio, aiohttp, time
start_time=time.time()
async def request(url):
	async with aiohttp.ClientSession() as session:
		async with session.get(url) as resp:
			resp_text=await resp.read()
			print(resp_text.decode('utf-8'))
loop=asyncio.get_event_loop()
tasks=[request('http://httpbin.org/headers')]
loop.run_until_complete(asyncio.wait(tasks))
print('用时：%s秒'%(time.time()-start_time))

运行结果：

虽然只有单任务，但是IO是通过交给操作系统处理的，速度也有一点的提升。那么在多任务的情况下会怎么样：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import asyncio, aiohttp, time
start_time=time.time()
response=[]
async def fn(url):
	async with aiohttp.ClientSession() as session:
		async with session.get(url=url) as resp:
			response.append(await resp.read())
loop=asyncio.get_event_loop()
tasks=[asyncio.ensure_future(fn('http://www.baidu.com')) for x in range(500)]
loop.run_until_complete(asyncio.wait(tasks))
#print(response)
print("用时%s秒" % (time.time()-start_time))

使用协程访问500次百度，运行结果：

我们再用同步的requests试一下：

60s!

猜你喜欢

转载自blog.csdn.net/getcomputerstyle/article/details/71514445

python爬虫之异步IO

python之异步IO

爬虫高并发之异步IO

python爬虫(二十一)-------------------异步IO

python之同步IO和异步IO

python爬虫(二十四)-------------------异步IO爬虫aiohttpa syncio

【Python学习之九】asyncio—异步IO

python爬虫之异步XHR爬取

Python之IO模式阻塞式io 非阻塞io 多路复用io 异步io 信号驱动io

python链家网异步IO爬虫asyncio+aiohttp+aiomysql异步存入数据库

异步IO之AIO

异步IO之asyncio

异步IO之aiohttp

异步IO之gevent

【python】异步IO

python 异步IO编程

Python 异步IO

Python异步IO

Python(十一)异步IO

Python学习--异步IO

《每日一课》Python入门之异步IO

【Python入门】49.异步IO之协程

python基础教程：异步IO 之概念和历史

python基础教程：异步IO 之 API

python基础教程：异步IO 之编程例子

python爬虫实战之异步爬取数据

python链家网异步IO爬虫，使用asyncio、aiohttp和aiomysql

Python 高级编程和异步IO并发编程 --13_9 asyncio高并发爬虫

异步IO之async/await

异步IO之tornado模块

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)