Python数据分析实战——口红的分析与推荐——情人节篇

前言

明天就是二·一四情人节了,真的是为正在恋爱中的情侣而难过,2020年的情人节注定是要陪伴自己的家人,莫担心,视频情人节、电话情人节、微信情人节都是不错的选择,好处呢?肯定是省钱、难忘且提醒自己竟然有一个女朋友(男朋友);不得不说,这个情人节对单身狗可能会友好一些,至少朋友圈的平静可以让自己少吃些单身solo20年的苦。
每次一到情人节,广大男性同胞却十分担忧,想要讨女朋友欢心的同时又不想将自己直男的气质外露,作为一个学生,口红和玫瑰可能是情人节礼物极好的选择,可是一个直男挑对一个口红色号就好比让一个女生在奥特曼家族中指出哪一个是迪迦,我们直男的苦女生不懂。
这篇文章基于Mac(魅可)Givenchy(纪梵希)、**Dior(迪奥)**三个比较常见的口红品牌进行简要分析,希望对广大男性同胞有一点小小的启发。

数据爬取

商品数据

口红商品数据是在淘宝上爬取的,淘宝是反爬机制很强的的一个网站,所以在爬取一个比较大的数据集时,需要模拟登陆,在这之后,如果访问频率过快,淘宝又会出现滑块验证,相对来说这个步骤比较繁杂。
在这里插入图片描述

评价数据

评价数据是通过asynciopyppeteer两个库获取每个网页的cookies,继而爬取每个页面上的评价内容及对应的口红色号,最终爬取Mac评价约610条、Givenchy评价约450条、Dior评价约370条。

数据分析

数据总览

在这里插入图片描述
这份数据集共有1980份样本,以及六个特征值
从左到右:口红名称、价格、店铺地址、收货人数、店铺名称、店铺网址
经过一系列数据清洗操作,得到比较规范的数据,如下图:
在这里插入图片描述

口红名称关键词提取

从所有口红名称文本中提取出偏重只最高的20个单词形成词云图:
在这里插入图片描述
大多数单词都是形容口红的特点,如哑光、磨砂、滋润等等

品牌占比及价格概况

通过口红名称title即可索引出其品牌
在这里插入图片描述
在这1980个样本中,MAC为三者中最高,占比超40%,Givenchy次之,而Dior仅占20%。
在这里插入图片描述
分析可知,Dior的平均价格为259.9MAC的平均价格仅有133.7Dior的价格约MAC的两倍;
所以穷买MAC,富买Dior,想改善生活可以尝试买一买Givenchy

口红销售额分析概况

三个品牌销售额如下图:
在这里插入图片描述
虽然Dior的价格为MAC的两倍,但有趣的是MAC的销售额不仅反超Dior,销售额甚至是Dior的两倍
可以大致将口红店铺大致分为五类:旗舰店、专营店、企业店铺、天猫店铺、自营店铺
在这里插入图片描述
其中Dior的专营店是其销售的支柱,而MACGivenchy的旗舰店可谓一支独大,撑起了绝大部分的销售,因为同一支口红的价格在不同的店铺浮动不会很大,所以对于众多美女姐姐来说,在这类官方渠道购买应该是最无忧的选择。

店铺分布概况

在这里插入图片描述
大多的口红店铺的地址分布在广东、江浙沪、山东,这对身在东北的人们太不友好了,快递由南至北几乎要跨越整个大陆,等快递真的是一件很苦的事。

口红色号分析

评价共抓取约1400条,色号销售量TOP10如下图:
在这里插入图片描述
其中MAC 316 DEVOTED TO CHILI 柔雾小辣椒Givenchy N37Dior 999为三个品牌最热门的色号;其中MAC CHILI 柔雾小辣椒色号约占MAC销售量的三分之一,应该是很火爆的色号。

简易口红推荐系统

搜索口红色号——>查看评价相比,由搜索评价——>推荐色号应该也是一种不错的选择,男性同胞和漂亮姐姐们可以通过女生的特点检索出对应的色号以供选择。
在这里插入图片描述在这里插入图片描述
这样检索之后,色号的选择范围就会减小,男性同胞们也更容易挑选到让女朋友心仪的口红色号啦。
以评价中偏重值最高的20个单词形成词云图:
在这里插入图片描述
图中绝大部分词语都是买家给出的积极评价,口红的差评似乎不是很多,但对于“老婆很喜欢”,“女朋友很喜欢”这类评价真是恨呀,又是这该死的嫉妒!

总结

1.Dior平均价格为MAC两倍——>穷买MAC,富买Dior
2.MAC 316 DEVOTED TO CHILI 柔雾小辣椒Givenchy N37Dior 999 是三个品牌最火的色号
3.Dior尽量在专营店购买、MACGivenchy尽量在旗舰店购买
关注微信公众号“奶糖猫”,后台回复“口红”可获取源码和数据供参考,感谢阅读!

发布了13 篇原创文章 · 获赞 140 · 访问量 6434

猜你喜欢

转载自blog.csdn.net/weixin_43434202/article/details/104291978