python淘宝关键字词云分析

版权声明:本文为博主原创文章,转载请注明出处和作者。 https://blog.csdn.net/vr7jj/article/details/81300608

前言

续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。

“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨

正文

0x01 数据来源

数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中

文件名
07月26日TOP20万词表PC.xlsx
07月26日TOP20万词表无线.xlsx
06月27日TOP20万词表PC.xlsx
06月27日TOP20万词表无线.xlsx
05月23日TOP20万词表无线.xlsx
4月25TOP20万词表无线.xlsx

0x02 代码

安装wordcloud 和 相关库存。详细安装说明

python库名
wordcloud
matplotlib
numpy
pillow
jieba

源代码块

import os
import jieba
import matplotlib.pyplot as plt
from os import path
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator


text = open(path.join(os.getcwd(), 'ranfa.txt')).read()
# print(text)
text = ' '.join(jieba.cut(text))
# print(text)
backgroud_Image = plt.imread('12.jpg')
wordcloud = WordCloud(
                background_color = 'black',   # 设置背景颜色
                mask = backgroud_Image,
                # max_words = 2000,           # 设置最大现实的字数
                stopwords = STOPWORDS,        # 设置停用词
                font_path='C:\Windows\Fonts\simsun.ttc',
                max_font_size=70,  # 设置字体最大值
                # min_font_size=5,
                random_state=42,
                scale=2,
            ).generate(text)

image_colors = ImageColorGenerator(backgroud_Image)
plt.imshow(wordcloud.recolor(color_func=image_colors))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

0x03 词云效果

这里写图片描述

分析

从图片我们一目了然,客户购买时最先搜索的关键字。淘宝卖家可以根据关键字优化标题,增加宝贝曝光率。
简要分析
1. 搜索频率最高是“染发”、“染发剂”。
2. 多数客户更佳关注无害“植物”、“纯天然”染发。
3. 颜色上更多客户选择黑色
更多分析…

源码下载

链接: https://pan.baidu.com/s/1xRkwQNePtRf_ScVtKsROHg
密码: 4edk

广告

纯天然植物提取染发剂,有需要的朋友客户关注下我老婆的店铺。

【广州威蒂娜品牌店】,復·制这段描述€kmMQb0VNFEr€后咑閞手机淘宝或者用浏览器咑閞http://m.tb.cn/h.32gDlKv查看

猜你喜欢

转载自blog.csdn.net/vr7jj/article/details/81300608