Python爬取某宝菠萝数据，并可视化分析销量

其他 2021-03-20 02:24:45 阅读次数: 0

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章来源于志斌的python笔记，作者志斌

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542

Python学习交流群：1039649593

前言

要说最近哪种水果最火，那就不得不说说菠萝了。随着“每3个中国菠萝就有1个来自徐闻”的话题登上各大平台热搜。徐闻菠萝迅速成为消费市场的热门商品。

随着徐闻菠萝高铁的开通大大降低了菠萝的运输成本和时间成本，这意味着我们可以以更低的价格吃上更新鲜的菠萝。在这种情况下，你还会担心网购的不新鲜吗？

数据获取

本文利用Python详细采集了淘宝网1774个商家菠萝的销售数据，获取到菠萝的店铺名称、商品名称、价格、产地、销量等数据，由于之前的文章已经详细介绍过淘宝网商家数据采集方法（不懂的看这篇文章用Requests+Cookie，轻松获取淘宝商品数据！），所以这里我们直接上代码:

response = requests.get('https://s.taobao.com/search', headers=headers, params=params)

shangpinming = re.findall('"raw_title":"(.*?)"',response.text)
jiage = re.findall('"view_price":"(.*?)"',response.text)
fahuodi = re.findall('"item_loc":"(.*?)"',response.text)
fukuanrenshu = re.findall('"view_sales":"(.*?)人付款"',response.text)
dianpumingcheng = re.findall('"nick":"(.*?)"',response.text)

数据处理

扫描二维码关注公众号，回复： 12779873 查看本文章

我们打开Excel文件对数据进行观察，发现有很多重复的数据，如图：

Python爬取某宝菠萝数据，并可视化分析销量

可能是因为某些店铺数据在不同页面中也存在导致的，我们可以采用pandas对数据进行清洗，但是这里我们可以用一种更简单的方式来对重复数据进行清洗，那就是Excel，它自带有删除重复项的功能，如图：

Python爬取某宝菠萝数据，并可视化分析销量

数据处理后，数据预览：

Python爬取某宝菠萝数据，并可视化分析销量

数据可视化

本文采取Excel进行菠萝数据可视化，因为在绘图方面Excel甚至强于Python！

菠萝价格分布图

Python爬取某宝菠萝数据，并可视化分析销量

从图中可得菠萝的价格45%在30元以下，绝大多数的在100元以下，根据国家统计局公布的全国人均可支配收入来看，实现菠萝自由还是挺简单的。

Python爬取某宝菠萝数据，并可视化分析销量

那些店铺的销量较好

Python爬取某宝菠萝数据，并可视化分析销量

从图中我们可以看出，销量前十的店铺9个都是旗舰店，看来当价格较低时，人们更加的注重商品质量。

价格与销量之间的关系

Python爬取某宝菠萝数据，并可视化分析销量

从散点图中我们可以看到，价格和销量基本上成反比，即价格越低，销量越高。

有三个点较高，可能是因为店铺的名气较大所导致的。

国内哪里盛产菠萝

Python爬取某宝菠萝数据，并可视化分析销量

对淘宝店铺所在地进行可视化发现，大部分店铺集中在广东、海南、浙江这些沿海地区，我专门上网搜了一下菠萝生产的条件：

Python爬取某宝菠萝数据，并可视化分析销量

在售菠萝的特点

Python爬取某宝菠萝数据，并可视化分析销量

我们将所有的商品名称做成词云图，从词云图中我们可以看出，菠萝商品数据的关键字有：新鲜、凤梨、罐头、零食、海南。整箱、包邮等等。

猜你喜欢

转载自blog.csdn.net/m0_48405781/article/details/115006265

Python爬取某宝菠萝数据，并可视化分析销量

Python爬取网站小说并可视化分析

记录一次Python爬取电影数据并可视化分析

Python爬取拉勾网招聘信息并可视化分析

Python爬取天气数据及可视化分析

Python爬取天气数据及可视化分析！

Python爬虫以及数据可视化分析之某站热搜排行榜信息爬取分析

某联-职位数据爬取及可视化分析

爬取京东淘宝商品销量并可视化处理数据

项目：可视化分析（后端爬取数据部分）

Python实现可视化案例：采集天气数据并可视化分析

Python爬取新楼盘近况数据，并进行可视化分析数据

采用python爬虫爬取数据然后采用echarts数据可视化分析

手把手教你用Python爬取某网小说数据，并进行可视化分析

python学习之数据爬取及其可视化分析（一）

python爬取天气数据并做可视化分析

基于Python的网络爬虫爬取天气数据可视化分析

读取csv文件数据并可视化分析

【创新课题】菠萝凤梨种植户种植决策系统：基于python爬虫菠萝凤梨电商销售数据可视化分析

【Python爬虫+可视化案例】采集电商网站商品数据信息，并可视化分析

【数据分析】豆瓣电影Top250爬取的数据的可视化分析

Python爬取58同城广州房源+可视化分析

python爬取网易云音乐评论并进行可视化分析

通过Python爬取QQ空间说说并通过Pyechart进行可视化分析

Python爬取周杰伦的200首歌+BI可视化分析

基于Python爬取Bangumi网站可视化分析ACG音乐发展

Python 爬取网页新闻内容文本可视化分析demo

基于Scrapy框架爬取租房网站数据及可视化分析

python数据获取与可视化分析

Python 数据可视化分析

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)