python爬虫爬取淘宝商品的销量 - 代码天地

python爬虫爬取淘宝商品的销量

其他 2018-08-14 22:08:41 阅读次数: 0

代码使用过程中如果有任何问题，下方留言，我会及时解释回答；

import re
import requests
import json
def openurl(keyword,page):
    params = {'q':keyword,'sort':'sale-desc','s':str(page*44)} 字典中第二项是按销量排序
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'}
    url = "https://s.taobao.com/search"
    res = requests.get(url,params=params, headers=headers)
    return res
def get_items(res):
    g_page = re.search(r'g_page_config = (.*?);\n', res.text)
    g_page_json = json.loads(g_page.group(1))
    p_items = g_page_json['mods']['itemlist']['data']['auctions']
    result = []
    for each in p_items:
        dict_items = dict.fromkeys(('title','raw_title','view_price','view_sales','comment_count','user_id'))
        dict_items['title'] = each['title']
        dict_items['raw_title'] = each['raw_title']
        dict_items['view_price'] = each['view_price']
        dict_items['view_sales'] = each['view_sales']
        dict_items['comment_count'] = each['comment_count']
        dict_items['user_id'] = each['user_id']
        result.append(dict_items)

    return result

def sale_num(items):
    count = 0
    for each in items:
        if '关键字'  in each['raw_title']:  #关键字处填写书的作者，或者某种商品特有的关键字
            print(each['raw_title'])
            count += int(re.search(r'\d+',each['view_sales']).group())
    return count
def main():
    keyword = input("请输入需要搜索销量的商品：")
    print(type(keyword))
    page_num = 3
    total_sale_num = 0
    for page in range(page_num):
        res = openurl(keyword,page)
        item = get_items(res)
        total_sale_num += sale_num(item)
    print('总销量为:',total_sale_num)
if __name__ == "__main__":
    main()

猜你喜欢

转载自blog.csdn.net/dxcve/article/details/81669521

python爬虫爬取淘宝商品的销量

Python爬虫之淘宝数据爬取（商品名称，价格，图片，销量）

Python爬取淘宝商品价格销量信息

python爬虫 — 爬取淘宝商品信息

python爬虫爬取淘宝网商品信息

Python爬虫爬取淘宝，京东商品信息

python 爬取淘宝商品

爬虫系列之淘宝商品爬取

爬虫爬取淘宝商品信息

python爬虫爬取淘宝商品比价（附淘宝反爬虫机制解决小办法）

python爬取淘宝商品比价实例（对re库的使用，淘宝反爬虫机制的解决）

Python爬取淘宝商品失败---解决：淘宝的反爬虫机制 - http重定向问题

Python搜索爬取淘宝商品信息并存储为csv文件（名称、店铺、销量、地址等）

爬取千万淘宝商品的python脚本

python爬取淘宝商品数据

Python爬取淘宝商品信息

python-爬取淘宝商品

Python爬取淘宝商品失败---解决

python爬取淘宝商品页面信息

爬取淘宝商品

Python基础项目——利用Python爬虫爬取淘宝网某类商品的图片

（廿八）Python爬虫：使用Selenium爬取淘宝商品信息

python爬虫爬取淘宝搜索页面商品信息数据

python爬虫之requests库传递cookies(爬取2019淘宝网商品列表)

Python爬虫模拟浏览器的headers、cookie，爬取淘宝网商品信息

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

Python爬取淘宝商品数据，价值千元的爬虫外包项目！

Python爬虫入门实例一之淘宝商品页面的爬取

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

Python爬取淘宝商品数据，价值千元的爬虫外包项目

今日推荐

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

android 文件上传（模拟表单提交）

node中遇到的一些问题

zhuanzai

树莓派3B板载蓝牙与HC05蓝牙模块配对(shell命令实现)

configparser模块简介 configparser模块简介

度度熊的01世界

浅谈log4j-6-xml配置转自godtrue

Kali无线渗透获取宿舍WiFi密码（WPA）

在VMware虚拟机中安装ubuntu

如何用微信公众号二维码事件做扫码登陆

每日归档

更多

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)