【京东】商品详情页+商品列表数据采集

作为国内最大的电商平台之一,京东数据采集具有多个维度。 

有人需要采集商品信息,包括品类、品牌、产品名、价格、销量等字段,以了解商品销售状况、热门商品属性,进行市场扩大和重要决策; 

有人需要采集产品评论,以明确产品优缺点、市场意向,进行新商品调研优化; 

除了以上之外,还有很多的应用场景等待挖掘。下面为大家详细介绍京东数据采集的方法。 

京东数据采集的方法 

既然京东数据采集极为需要势在必行,那么该如何进行操作呢?是找到要采集的京东网址,将数据一条条复制粘贴到excel表格中?还是找一个爬虫工程师,写爬虫程序进行采集? 

于普通人而言,这两种方法成本极高,效率低下——第一种耗费大量人力,还可能有多次出错;第二种成本很高且需要较长的学习时间,短时间内难以完成。有没有一种普通人都能简单采集京东的方法呢? 

以下是我们整理的几个京东数据采集教程,大家可以按图文描述来操作即可,字段提取可根据自己的实际需求增减。 

一、京东商品信息采集 

采集内容:京东搜索关键词后,出现的商品列表信息采集 

采集字段:商品标题,商品链接,商品价格,商品图片链接,商品评价数量,商品店铺名称,商品店铺链接 

打开京东商品详情页(实例网址:https://item.jd.com/100016944073.html ),采集点击不同的参数(颜色、版本等)后得到的数据(商品编号、价格、主图链接等字段会随着参数变化而变化)。

采集字段

商品标题、颜色、版本、价格、商品名称、商品编号、图片网址等。

采集结果

采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:

 

 封装成京东商品详情数据(JD.item_get_app)接口代码展示

1.请求方式  :HTTP  GET POST

2.请求公共参数:

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中,请求链接:http://c0b.cc/R4rbK2
secret String 调用密钥 (复制v:Taobaoapi2014 )
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

3.请求代码示例,支持高并发请求(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-gw.19970108018.cn/jd/item_get/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=10335871600"
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

4.代码错误码说明

猜你喜欢

转载自blog.csdn.net/tbprice/article/details/130321559