500 Lines or Less | A Web Crawler With asyncio Coroutines:用协程写web爬虫 - 代码天地

500 Lines or Less | A Web Crawler With asyncio Coroutines:用协程写web爬虫

其他 2018-10-19 09:08:25 阅读次数: 0

 1 def fetch(url):
 2     sock = socket.socket()
 3     sock.connect(('xkcd.com', 80))
 4     request = 'GET {} HTTP/1.0\r\nHost: xkcd.com\r\n\r\n'.format(url)
 5     sock.send(request.encode('ascii'))
 6     response = b''
 7     chunk = sock.recv(4096)
 8     while chunk:
 9         response += chunk
10         chunk = sock.recv(4096)
11 
12     # Page is now downloaded.
13     links = parse_links(response)
14     q.add(links)

　　

猜你喜欢

转载自www.cnblogs.com/beautycode/p/9814372.html

500 Lines or Less | A Web Crawler With asyncio Coroutines:用协程写web爬虫

GitHub 上的“神书”：《500 Lines or Less》

Build a Web Crawler

pythong--web crawler

Question about web crawler

web crawler(JAVA)

坑 python学习之 500 lines or less 杂项

[Java] 网络爬虫(Web Crawler)

Web Crawler的体系结构

Web Crawler与Scrap技术分析

Answer：web crawler question 1

Answer：web crawler question the rest

某音的web crawler方案

《500 Lines or Less》经典开源程序OCR——探索修改之旅（附程序源码）

python--web crawler-II

爬虫crawler

Web Crawler 网路爬虫源码-Py语言-立哥开发

使用Asyncio+Flask开发Web应用

asyncio创建协程解析——分析廖雪峰的Python教程之创建WEB服务

Python协程与asyncio

asyncio 异步协程

asyncio协程

python---aiohttp的使用 python asyncio 获取协程返回值和使用callback 500并发测试

Web前端学习笔记——LESS

基于asyncio实现的异步协程爬虫

协程的简单应用（aiohttp,asyncio）---爬虫

用python启动web服务500错误

一个易用的轻量级的网络爬虫(Easy to use lightweight web crawler)

crawler

异步IO（ asyncio）协程

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)