NLP 搜索文本 计数词汇

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_35774189/article/details/84554871

基于上一篇博客,已经得到各文本的数据,现在开始对这些数据进行处理:搜索文本

1、利用concordance函数来查找文本中的词:如monstrous、affection、lived

2、利用similar函数查找相似文本

3、common_contexts函数研究共用两个或两个以上词汇的上下文

4、利用dispersion_plot函数绘制离散图

计数词汇:

使用len函数获取长度,使用set获取唯一词汇,sorted函数得到一个排序表(大写字母出现在小写字母之前)

接下来,统计特定的词:

计数一个单词在文本中出现的次数,计算一个特定词在文本中占据的百分比

使用函数对几个文本重复计算,调用即可

猜你喜欢

转载自blog.csdn.net/qq_35774189/article/details/84554871
NLP