Stanford Speech and Language Processing-2.5 Distancia de edición

Tabla de contenido


La distancia mínima de edición está destinada a definir la similitud de palabras entre dos cadenas. La definición de similitud se puede utilizar para corregir errores ortográficos, alineación de secuencias en biología computacional, traducción automática, extracción de información, reconocimiento de voz, etc.

La distancia de edición se refiere al número mínimo de ediciones necesarias para transformar una cadena de operaciones de edición, incluida la inserción, eliminación y sustitución en otra cadena.
Inserte la descripción de la imagen aquí
Defina la distancia de edición mínima (Levinstein):
Inserte la descripción de la imagen aquí
La matriz de distancia para calcular la distancia entre la intención y la ejecución es la siguiente: (consulte el video de bilibil a continuación)
Inserte la descripción de la imagen aquí
Trazado atrás En
muchos casos, solo registrar la distancia de edición no es suficiente, debe agregar dos columnas Correspondencia uno a uno de la cadena con la información de ubicación específica (como corrección de errores ortográficos). Por lo tanto, se utiliza un puntero para registrar información de posición para retroceder. Dado que lo que se requiere es la distancia de edición más corta, apúntelo en la cuadrícula de cada operación de edición a la cuadrícula con la distancia de edición más pequeña de la operación anterior, y finalmente se puede obtener la información correspondiente específica para la comparación.
Inserte la descripción de la imagen aquí
Inserte la descripción de la imagen aquí

Referencia de código para la distancia de edición:
https://www.cnblogs.com/labuladong/p/12320390.html

Edite la referencia de comprensión de la imagen de distancia:
https://www.bilibili.com/video/av201495033/

Referencia de explicación de PPT:
https://www.cnblogs.com/arkenstone/p/6196111.html

Supongo que te gusta

Origin blog.csdn.net/weixin_48760912/article/details/114868795
Recomendado
Clasificación