Procesamiento del lenguaje natural: el método disponible de sklearn para calcular la distancia entre los vectores de características

La distancia entre los vectores de características (vectores de palabras, vectores de temas, vectores de contexto de documentos, etc.) impulsa el rendimiento de la canalización de PNL o de cualquier canalización de aprendizaje automático.

Distancias por pares disponibles en sklearn:

'cityblock', 'cosine', 'euclidean', 'l1', 'l2', 'manhattan', 'braycurtis', 
'canberra', 'chebyshev', 'correlation', 'dice', 'hamming', 'jaccard', 
'kulsinski', 'mahalanobis', 'matching', 'minkowski', 'rogerstanimoto', 
'russellrao', 'seuclidean', 'sokalmichener', 'sokalsneath', 'sqeuclidean', 
'yule'

Supongo que te gusta

Origin blog.csdn.net/fgg1234567890/article/details/112439523
Recomendado
Clasificación