Tabla de contenido
La distancia mínima de edición está destinada a definir la similitud de palabras entre dos cadenas. La definición de similitud se puede utilizar para corregir errores ortográficos, alineación de secuencias en biología computacional, traducción automática, extracción de información, reconocimiento de voz, etc.
La distancia de edición se refiere al número mínimo de ediciones necesarias para transformar una cadena de operaciones de edición, incluida la inserción, eliminación y sustitución en otra cadena.
Defina la distancia de edición mínima (Levinstein):
La matriz de distancia para calcular la distancia entre la intención y la ejecución es la siguiente: (consulte el video de bilibil a continuación)
Trazado atrás En
muchos casos, solo registrar la distancia de edición no es suficiente, debe agregar dos columnas Correspondencia uno a uno de la cadena con la información de ubicación específica (como corrección de errores ortográficos). Por lo tanto, se utiliza un puntero para registrar información de posición para retroceder. Dado que lo que se requiere es la distancia de edición más corta, apúntelo en la cuadrícula de cada operación de edición a la cuadrícula con la distancia de edición más pequeña de la operación anterior, y finalmente se puede obtener la información correspondiente específica para la comparación.
Referencia de código para la distancia de edición:
https://www.cnblogs.com/labuladong/p/12320390.html
Edite la referencia de comprensión de la imagen de distancia:
https://www.bilibili.com/video/av201495033/
Referencia de explicación de PPT:
https://www.cnblogs.com/arkenstone/p/6196111.html