[Estructura de datos] Informe del experimento sobre estadísticas de frecuencia de palabras y sistema de recuperación de palabras en inglés basado en diferentes estrategias

Informe experimental sobre estadísticas de frecuencia de palabras y sistema de recuperación de palabras en inglés basado en diferentes estrategias.

Tareas experimentales

Un artículo en inglés se almacena en un archivo de texto, basado en diferentes estructuras de almacenamiento de tablas lineales, árboles de clasificación binaria y tablas hash, para implementar estadísticas de frecuencia de palabras y funciones de recuperación de palabras. Al mismo tiempo, se calcula el ASL bajo diferentes estrategias de recuperación y se realiza el análisis comparativo correspondiente del rendimiento temporal de diferentes estrategias de recuperación comparando el tamaño del ASL. Los contenidos específicos son los siguientes.

1. Un artículo en inglés que incluye signos de puntuación se almacena en el archivo de texto Infile.txt y se supone que el número de palabras del archivo no supera las 5000. Lea palabras en inglés de este archivo y filtre toda la puntuación.

2. Realizar estadísticas de frecuencia de palabras y funciones de recuperación de palabras basadas en diferentes estructuras de almacenamiento de tablas lineales, árboles de clasificación binaria y tablas hash. Entre ellos, la tabla lineal utiliza dos estructuras de almacenamiento diferentes, la lista secuencial y la lista vinculada, para implementar la búsqueda secuencial respectivamente, y al mismo tiempo realiza la búsqueda media basada en la tabla secuencial; la tabla hash implementa la búsqueda hash basada en el método de dirección abierta y el hash basado en el método de dirección en cadena respectivamente. Por tanto, se implementan un total de 6 estrategias de recuperación diferentes.

3. No importa qué estrategia de búsqueda se adopte, las funciones logradas son las mismas.

Supongo que te gusta

Origin blog.csdn.net/weixin_46221946/article/details/132818524
Recomendado
Clasificación