Una guía para bases de datos vectoriales - Demostración de funciones Faiss utilizando el conjunto de datos SQuAD

Demostración utilizando el conjunto de datos SQuAD


 

Ahora, podemos entender la funcionalidad de Faiss con una demostración de ejemplo. En este ejemplo, utilizaremos el conjunto de datos de respuesta a preguntas de Stanford (SQuAD). SQuAD es un conjunto de datos de procesamiento de lenguaje natural (NLP) de uso común. El conjunto de datos se basa en las preguntas formuladas por los usuarios en Wikipedia. La respuesta a cada pregunta proviene de un fragmento de texto correspondiente al pasaje de lectura, con un total de 100.000 de más de 500 artículos. Múltiples pares de preguntas y respuestas.


 

Antes de profundizar en el código de ejemplo, descargue el conjunto de datos SQuAD:


 

1. Descargue el conjunto de datos SQuAD (https://rajpurkar.github.io/SQuAD-explorer/)


 

Los ejemplos de este artículo utilizarán SQuAD 1.1. Puede descargar el conjunto de datos SQuAD 1.1 aquí. Una vez completada la descarga, guarde el archivo JSON descargado (train-v1.1.json) en el directorio de archivos comunes.


 

 </

Supongo que te gusta

Origin blog.csdn.net/qinglingye/article/details/132039212
Recomendado
Clasificación