文本词频统计的应用——以微词云平台为例

词频分析(Word Frequency Analysis):对一文本数据中某词汇出现的次数进行统计与分析,是文本挖掘的重要手段。词频分析也是数据分析和挖掘的重要方式,而结果通常以词云图的形式输出。

词频分析通常结合Python等一起使用,常见于商品分析等。其实,我们也可以对文本信息进行词频分析,从而把握其中的中心思想或是关键信息。同时,也有许多平台和工具可以实现零代码和在线进行词频分析。这里我们以微词云为例,介绍如何使用微词云对一篇文章进行词频分析。

首先,按照惯例,我们给出网址:

微词云:www.weiciyun.com

进入首页,我们选择【文本词频统计】这一模块

接下来,完成内容的输入或导入:我们可以直接将文本粘贴在文本框中,或是以txt/excel的形式导入文件。这里我们选择复制粘贴《再别康桥》原文。

在这里我们也可以根据需要自定义词典或是设置同义词。确认无误后,点击下一步。此时,弹窗提醒是否去重,根据实际需要选择即可。(这里我们不选择去重,点击确定)

之后,就是一个个人十分偏爱的功能(也是本平台的一个亮点):根据文本信息得出一份多维度的分析报告,根据这份报告,我们就可以完成一些基础的数据分析工作了。

至于如何使用和分析这些数据,就要结合具体需要而定了。一般而言,这份分析报告已足以支撑一些基础的分析工作。

此外,我们也可以选择将词云图进行个性化设计。点击美化词云图,进行详细制作。在工作台中对其形状、字体等进行调整,以实现最佳的美化效果。之后,我们可以将词云图输出保存。

​更多信息:欢迎微信搜索【角砾岩队长的GIS空间】

猜你喜欢

转载自blog.csdn.net/m0_57340659/article/details/127659461