Python网络爬虫与信息提取（4）—— 实战之爬取亚马逊商品信息

其他 2020-07-28 14:01:25 阅读次数: 0

前言

上一节爬取了IP地址，这一节爬取亚马逊的单个商品信息，对爬取代码进行一点点优化。

完整代码

import requests as req
url = "https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
    kv = {'user-agent': 'Mozilla/5.0'}
    r = req.get(url,headers = kv)
    r.raise_for_status()
    print(r.text[1000:2000])
except:
    print("爬取失败")

首先导入requests库
复制网页商品的url过来
用try except捕获爬取失败的异常
kv模拟浏览器访问
获取浏览器的响应
r.raise_for_status()触发异常，如果返回的代码不是200就会触发异常
没有异常则打印文本内容
异常了则提示爬取失败

猜你喜欢

转载自blog.csdn.net/qq_37668436/article/details/105710127

Python网络爬虫与信息提取（4）—— 实战之爬取亚马逊商品信息

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

Python网络爬虫与信息提取（一）

Python网络爬虫与信息提取

Python网络爬虫与信息提取（5）—— 实战之爬取网页图片并保存

网络爬虫与信息提取

Python网络爬虫与信息提取（五）信息标记与信息提取的一般方法

Python 信息提取-爬虫

Python 爬虫基础学习--网络爬虫与信息提取

Python网络爬虫与信息提取（2）—— 爬虫协议

Python网络爬虫与信息提取（9）—— scrapy实战之爬取黑马程序员网页讲师信息

网络爬虫笔记4，信息提取之Re库

python之网络爬虫与信息提取(上篇)

Python实战1_2：爬取商品信息

爬虫之selenium爬取京东商品信息

Python网络爬虫与信息提取（四）bs4的内容遍历方法及注意事项

Python网络爬虫与信息提取（三）bs4入门

Python网络爬虫基于BeautifulSoup4库的信息提取

python爬虫学习笔记4：信息提取

Python网络爬虫与信息提取（二）**kwargs参数详解

Python网络爬虫和信息提取（一）

2018.5.4(python网络爬虫与信息提取入门)Robots协议

Python网络爬虫与信息提取_Requests库

Python网络爬虫与信息提取Day2

Python网络爬虫与信息提取Day1

python网络爬虫和信息提取(mooc)

Python网络爬虫与信息提取(实例讲解)

Python网络爬虫信息提取mooc代码实例

Python 网络爬虫与信息提取（第三周）

Python 网络爬虫与信息提取（第二周）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)