版权声明:本文为博主原创文章,转载请注明出处和作者。 https://blog.csdn.net/vr7jj/article/details/81300608
前言
续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。
“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨
正文
0x01 数据来源
数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中
文件名 |
---|
07月26日TOP20万词表PC.xlsx |
07月26日TOP20万词表无线.xlsx |
06月27日TOP20万词表PC.xlsx |
06月27日TOP20万词表无线.xlsx |
05月23日TOP20万词表无线.xlsx |
4月25TOP20万词表无线.xlsx |
0x02 代码
安装wordcloud 和 相关库存。详细安装说明
python库名 |
---|
wordcloud |
matplotlib |
numpy |
pillow |
jieba |
源代码块
import os
import jieba
import matplotlib.pyplot as plt
from os import path
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
text = open(path.join(os.getcwd(), 'ranfa.txt')).read()
# print(text)
text = ' '.join(jieba.cut(text))
# print(text)
backgroud_Image = plt.imread('12.jpg')
wordcloud = WordCloud(
background_color = 'black', # 设置背景颜色
mask = backgroud_Image,
# max_words = 2000, # 设置最大现实的字数
stopwords = STOPWORDS, # 设置停用词
font_path='C:\Windows\Fonts\simsun.ttc',
max_font_size=70, # 设置字体最大值
# min_font_size=5,
random_state=42,
scale=2,
).generate(text)
image_colors = ImageColorGenerator(backgroud_Image)
plt.imshow(wordcloud.recolor(color_func=image_colors))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
0x03 词云效果
分析
从图片我们一目了然,客户购买时最先搜索的关键字。淘宝卖家可以根据关键字优化标题,增加宝贝曝光率。
简要分析
1. 搜索频率最高是“染发”、“染发剂”。
2. 多数客户更佳关注无害“植物”、“纯天然”染发。
3. 颜色上更多客户选择黑色
更多分析…
源码下载
链接: https://pan.baidu.com/s/1xRkwQNePtRf_ScVtKsROHg
密码: 4edk
广告
纯天然植物提取染发剂,有需要的朋友客户关注下我老婆的店铺。
【广州威蒂娜品牌店】,復·制这段描述€kmMQb0VNFEr€后咑閞手机淘宝或者用浏览器咑閞http://m.tb.cn/h.32gDlKv查看