亚马逊商品页面爬取 - 代码天地

亚马逊商品页面爬取

其他 2020-03-12 19:28:33 阅读次数: 0

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
    r=requests.get(url)
    print(r.status_code)
    print(r.request.headers) # 亚马逊识别了此次访问是由'User-Agent': 'python-requests/2.23.0'发起的，故拒绝了访问
    kv={'User-Agent': 'Mozilla/5.0'} # Mozilla/5.0是浏览器身份标识字段 修改User-Agent
    r = requests.get(url,headers=kv)
    print(r.status_code)
    r.raise_for_status() # 如果非200 则触发异常
    r.encoding=r.apparent_encoding
    print(r.text[0:1000])
except:
    print("爬取失败")

结果：
503
{‘User-Agent’: ‘python-requests/2.23.0’, ‘Accept-Encoding’: ‘gzip, deflate’, ‘Accept’: ‘/’, ‘Connection’: ‘keep-alive’}
200

Amazon CAPTCHA

if (true === true) {
var ue_t0 = (+ new Date()),
ue_csm = window,
ue = { t0: ue_t0, d: function() { return (+new Date() - ue_t0); } },
ue_furl = “fls-cn.amazon.cn”,
ue_mid = “AAHKV2X7AFYLW”,

名字不要太长像我这样就好0

发布了15 篇原创文章 · 获赞 5 · 访问量 7660

私信关注

猜你喜欢

转载自blog.csdn.net/qq_39926861/article/details/104768950

亚马逊商品页面爬取

示例2_亚马逊商品页面爬取

Python爬虫之Requests库——亚马逊商品页面的爬取

Python爬虫入门实例二之亚马逊商品页面的爬取

京东商品页面爬取

python爬取淘宝商品页面信息

python爬取京东商品页面信息

网络爬虫爬取淘宝商品页面数据

网络爬虫-京东商品页面的爬取

requests实例1：京东商品页面的爬取

示例1_京东商品页面爬取

Python网络爬虫与信息提取（4）—— 实战之爬取亚马逊商品信息

爬取淘宝商品

爬取京东商品

关于网络爬虫的的四个实例（爬取京东和亚马逊商品，百度搜索关键词，爬取一张图片）

python 爬取淘宝商品

爬取商品评论

python京东商品爬取

Selenium工具爬取商品

爬取京东商品的评论

Python爬取京东商品

爬取京东商品（js）

爬取京东商品并分析

亚马逊产品图片爬取

Python Requests库入门——应用实例-京东商品页面爬取

爬取购物网站某类商品多个页面并存储

python爬虫爬取淘宝搜索页面商品信息数据

Python爬虫入门实例一之淘宝商品页面的爬取

使用HttpClient和Jsoup爬取京东商城关键字搜索的商品页面

爬取页面

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)