[nlp] TF-IDF算法介绍

(1)TF是词频(Term Frequency)

词频是文档中词出现的概率。

(2) IDF是逆向文件频率(Inverse Document Frequency)

包含词条的文档越少,IDF越大。

猜你喜欢

转载自blog.csdn.net/Trance95/article/details/132004950