Cómo elegir una base de datos vectorial | Qdrant Cloud vs Zilliz Cloud

17120002:

Desde datos hasta aplicaciones de modelos grandes, el 25 de noviembre se celebró la Conferencia Hangzhou Yuanchuang para compartir consejos de desarrollo.

A medida que la popularidad de las bases de datos vectoriales sigue aumentando, cada vez más personas prestan atención a esta vía. Las bases de datos tradicionales y los sistemas de recuperación también compiten por la rápida integración de complementos especializados de recuperación de vectores. Qdrant rápidamente ganó popularidad debido a su facilidad de uso y a su documentación para desarrolladores intuitiva.

Qdrant está construido en el lenguaje Rust y proporciona API de cliente como Rust, Python y Golang para satisfacer las necesidades de los principales desarrolladores actuales. Sin embargo, Qdrant, como estrella en ascenso, todavía tiene ciertas lagunas con respecto a otros productos de la competencia, como una interfaz y funciones de consulta insuficientes.

Entonces, ¿cuál es la diferencia entre Qdrant y Zilliz Cloud/Milvus? Se puede entender que ambos están diseñados especialmente para datos vectoriales, pero son adecuados para diferentes escenarios. Qdrant es más adecuado para desarrolladores que buscan un mantenimiento de infraestructura de bajo costo. Si el sistema de aplicaciones presta más atención al rendimiento y la escalabilidad, Zilliz Cloud/Milvus es una opción más adecuada. Debido a que Zilliz Cloud/Milvus tiene las características de gran escalabilidad, mejor rendimiento y menor latencia, es adecuado para escenarios que tienen requisitos estrictos en cuanto a indicadores de rendimiento.

Este artículo dejará de lado estas diferencias superficiales y profundizará en las diferencias entre Qdrant Cloud y Zilliz Cloud comparando sus resultados comparativos de rendimiento y las características relacionadas con Qdrant Cloud.

01.

Qdrant Cloud vs Zilliz Cloud: competencia de rendimiento

Recientemente, a medida que el sistema de generación aumentada de recuperación (RAG) sigue siendo popular, los desarrolladores se han vuelto cada vez más confundidos acerca de "cómo elegir una base de datos vectorial". En las últimas semanas, hemos realizado una comparación detallada entre Qdrant Cloud y Zilliz Cloud en términos de rendimiento y capacidades de funciones.

Durante el proceso de comparación, utilizamos el conjunto de pruebas de rendimiento de código abierto VectorDBBench para realizar pruebas en torno a indicadores clave como consultas por segundo (QPS), consultas por dólar (QP$) y latencia.

[Gran conjunto de datos de prueba (≥ 5 millones de datos vectoriales)]

Los siguientes son los dos tipos de conjuntos de datos utilizados en la prueba:

El conjunto de datos 1 contiene 10.000.000 de datos vectoriales de 768 dimensiones.
El conjunto de datos 2 contiene 5.000.000 de datos vectoriales de 1.536 dimensiones.

Objeto de prueba

Los siguientes son los ejemplos utilizados durante las pruebas. Estos ejemplos son básicamente similares en la configuración del hardware:

Zilliz Cloud (8cu-perf): instancia de rendimiento de Zilliz Cloud 8 CU
Zilliz Cloud (2cu-cap): instancia de capacidad de Zilliz Cloud 2 CU
Qdrant Cloud (4c16g-5node): Qdrant Cloud 4 CPU 16G de memoria, usando instancias de 5 máquinas

Consultas por segundo (QPS)

Los resultados de la prueba muestran que al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, el QPS de las dos instancias de Zilliz Cloud es 7 veces y 1 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.

Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, el QPS de la instancia de Zilliz Cloud (8cu-perf) es 8 veces mayor que el de la instancia de Qdrant Cloud, pero el QPS de la instancia de Zilliz Cloud (2cu-cap) es inferior al de Qdrant Cloud instancia.

Consultas por dólar (QP$)

Al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 8 y 5 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.

Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 7 veces y 3 veces el de la instancia de Qdrant Cloud, respectivamente.

Demora

Al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, las latencias P99 de las dos instancias de Zilliz Cloud son 1/12 y 1/3 de la instancia de Qdrant Cloud respectivamente.

Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, la latencia P99 de las dos instancias de Zilliz Cloud es 8 veces y 1 veces más rápida que la instancia de Qdrant Cloud, respectivamente.

[Conjunto de datos de prueba de tamaño mediano (<5 millones de datos vectoriales)]

Los siguientes son los dos tipos de conjuntos de datos utilizados en la prueba:

El conjunto de datos 3 contiene 1.000.000 de datos vectoriales de 768 dimensiones.
El conjunto de datos 4 contiene 500.000 datos vectoriales de 1.536 dimensiones.

Objeto de prueba

Los siguientes son los ejemplos utilizados durante las pruebas. Estos ejemplos son básicamente similares en la configuración del hardware:

Zilliz Cloud (1cu-perf): instancia de rendimiento de Zilliz Cloud 1 CU
Zilliz Cloud (1cu-cap): instancia de capacidad de 1 CU de Zilliz Cloud
Qdrant Cloud (4c16g-1node): Qdrant Cloud 4 CPU 16G de memoria, usando 1 instancia de máquina

Consultas por segundo (QPS)

Los resultados de la prueba muestran que al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, el QPS de las dos instancias de Zilliz Cloud es 2 veces y 1 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.

Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, el QPS de la instancia de Zilliz Cloud (1cu-perf) es 2 veces mayor que el de la instancia de Qdrant Cloud, pero el QPS de la instancia de Zilliz Cloud (1cu-cap) es menor que el de Qdrant Cloud instancia.

Consultas por dólar (QP$)

Al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 4 y 2 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.

Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 3 veces y 1 vez mayor que el de la instancia de Qdrant Cloud, respectivamente.

Demora

Al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, la latencia P99 de ambas instancias de Zilliz Cloud es 2 veces más rápida que la instancia de Qdrant Cloud.

Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, la latencia P99 de las dos instancias de Zilliz Cloud es 127 veces y 27 veces más rápida que la instancia de Qdrant Cloud, respectivamente.

[Resultado: puntuación integral]

La figura anterior muestra la puntuación de rendimiento (escala porcentual) de cada instancia en diferentes casos de uso. Cuanto mayor sea la puntuación, mayor será el rendimiento. Los criterios de puntuación específicos se pueden encontrar aquí.

https://github.com/zilliztech/VectorDBBench/tree/main#leaderboard。

La figura anterior muestra la puntuación de rendimiento (>1) de cada instancia en diferentes casos de uso (https://zilliz.com/vector-database-benchmark-tool#comparison-section). Cuanto menor sea la puntuación, mayor será el rendimiento.

上述性能基准测试结果由开源的 VectorDBBench（https://github.com/zilliztech/VectorDBBench）工具提供。在工具的 GitHub 主页上，还可以看到向量数据库的排行榜。VectorDBBench 为主流的向量数据库和相关云服务提供了公正的性能测试基准（https://zilliz.com.cn/benchmark）。该工具有着良好的易用性，可以轻而易举地在众多向量数据库云服务和开源向量数据库中找到最佳选择。

02.

Qdrant Cloud 特性对比

随着向量数据库可以存储的数据量呈几何级数的增长，性能也成为了向量数据库的重大挑战。为了保障数据检索性能，数据库的跨节点横向扩展能力至关重要。另外，数据插入速率、检索速率以及底层硬件的不同可能会衍生出不同的应用需求，这也让全局参数调节能力成为向量数据库的必备能力之一。