TF(Term Frequency)
表示某个关键词在整篇文章中出现的频率。IDF(InversDocument Frequency)
表示计算倒文本频率。文本频率是指某个关键词在整个语料所有文章中出现的次数。倒文档频率又称为逆文档频率,它是文档频率的倒数,主要用于降低所有文档中一些常见却对文档影响不大的词语的作用。
大数据中的一些名词
猜你喜欢
转载自blog.csdn.net/m0_37664906/article/details/80816125
今日推荐
周排行