爬虫:大淘客(淘宝商品数据) 5000--10000条数据

vx:13237066568

1数据情况说明

1.1数据来源

主网站:url=‘http://www.dataoke.com/qlist/’
变量为cid和page,cid控制类目,page控制页码,
因此获得的组合网址格式之一为:‘http://www.dataoke.com/qlist/?uid=1&page=2’

1.1.1网站介绍

该网站是一个淘宝平台的下级推广网站,为阿里巴巴旗下阿里妈妈平台推广,网站商品皆为淘宝商品,由于淘宝网站反爬严重,故用此网站采集数据!

1.1.2获取时间

2019-11-7

1.1.3数据量级

5553

1.2数据描述

“店铺名”: 淘宝店铺名字
“商品地址”:淘宝店铺商品url
“标题”:淘宝商品在大淘客网的标题
“商品类型”:商品的类型
“价格”:商品的目前价格
“原价”:商品原价
“券额度”:商品的优惠额度
“月销量”:商品的月销量
“评论”:商品的评论量
“来源”:商品是哪个平台(天猫,淘宝,天猫超市)
“运费险”:商品是否赠送运费险
“推荐文案”:商品的推广文案
“团队”:商品所属的推广团队
“到期时间”:商品本次推广的到期时间
“主图地址”:主图的url

1.2.1数据基本情况

1.数据的类型为字符串类型,并存储为文本,cs和json文件永久保存
2.数据完整性:111.06%

1.2.2数据列意义描述

大淘客网站作为淘宝客推广中举足轻重的平台,平台分类有14类之多,由这些数据的

猜你喜欢

转载自blog.csdn.net/Captain_DUDU/article/details/102970529