2018.5.3（python网络爬虫与信息提取入门）Requests库的爬取性能分析 - 代码天地

2018.5.3（python网络爬虫与信息提取入门）Requests库的爬取性能分析

其他 2018-09-26 03:39:57 阅读次数: 0

尽管Requests库功能很友好、开发简单（其实除了import外只需一行主要代码），但其性能与专业爬虫相比还是有一定差距的。

编写一个小程序，找个url，测试一下成功爬取多次网页的时间。（某些网站对于连续爬取页面将采取屏蔽IP的策略，所以，要避开这类网站。）

import requests
import time
def GetHtml(url):
    try:
        r=requests.get(url,timeout=30)   #请求一个url连接 超时时间为30S
        r.raise_for_status()             #如果状态不是200，引发HTTPError异常        
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("Generate an exception")   
url="http://www.apple.com/"
for i in range(2):
    start_time=time.time()
    text=GetHtml(url)
    end_time=time.time()
    print(i+1,':',end_time-start_time)
    print("用时{:.3}".format(end_time-start_time))

1 : 0.4793558120727539
用时0.479
2 : 0.25616884231567383
用时0.256
>>>

猜你喜欢

转载自blog.csdn.net/weixin_41815104/article/details/80188539

2018.5.3（python网络爬虫与信息提取入门）Requests库的爬取性能分析

2018.5.3（python网络爬虫与信息提取入门）语言开发工具 / Requests库入门

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

Python网络爬虫与信息提取_Requests库

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

2018.5.4（python网络爬虫与信息提取入门）Requests库的五个实例

嵩天教授的Python网络爬虫与信息提取课程笔记——requests库入门

Python网络爬虫与信息提取之单元一requests库入门代码实战

Python网络爬虫与信息提取笔记01-Requests库入门

Python网络爬虫与信息提取（6）—— 爬取csdn个人博客数据信息

Python网络爬虫与信息提取（4）—— 实战之爬取亚马逊商品信息

python网络爬虫与信息提取mooc------爬取实例

Python网络爬虫与信息提取（5）—— 实战之爬取网页图片并保存

Python网络爬虫与信息提取（10）—— 代码搜索全网音乐爬取并下载

Python网络爬虫与信息提取（一）requests库的安装与基本方法之get()方法

Python网络爬虫与信息提取（二）——HTTP协议及Requests库的方法

Python网络爬虫与信息提取（1）—— 基于pycharm的requests库学习

python爬取淘宝页面cookie requests库和re正则表达式库（最新）中国大学MOOC嵩天Python网络爬虫与信息提取cookie

Python网络爬虫与信息提取笔记03-Requests库网络爬虫实战（5个实例）

Python网络爬虫与信息提取（9）—— scrapy实战之爬取黑马程序员网页讲师信息

2018.5.4(python网络爬虫与信息提取入门)Robots协议

Python网络爬虫与信息提取笔记04-Beautiful Soup库入门

Python网络爬虫与信息提取（一）

Python网络爬虫与信息提取

网络爬虫与信息提取

Python网络爬虫与信息提取笔记07-Re（正则表达式）库入门

Python网络爬虫与信息提取（五）信息标记与信息提取的一般方法

Python 信息提取-爬虫

Python 爬虫基础学习--网络爬虫与信息提取

Python网络爬虫与信息提取（2）—— 爬虫协议

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)