自然语言处理--sklearn计算特征向量之间距离的可用方法

特征向量(词向量、主题向量、文档上下文向量等)之间的距离驱动着 NLP 流水线或任何机器学习流水线的性能。

sklearn 中可用的成对距离:

'cityblock', 'cosine', 'euclidean', 'l1', 'l2', 'manhattan', 'braycurtis', 
'canberra', 'chebyshev', 'correlation', 'dice', 'hamming', 'jaccard', 
'kulsinski', 'mahalanobis', 'matching', 'minkowski', 'rogerstanimoto', 
'russellrao', 'seuclidean', 'sokalmichener', 'sokalsneath', 'sqeuclidean', 
'yule'

猜你喜欢

转载自blog.csdn.net/fgg1234567890/article/details/112439523