Cómo elegir una base de datos vectorial | Qdrant Cloud vs Zilliz Cloud

17120002:


A medida que la popularidad de las bases de datos vectoriales sigue aumentando, cada vez más personas prestan atención a esta vía. Las bases de datos tradicionales y los sistemas de recuperación también compiten por la rápida integración de complementos especializados de recuperación de vectores. Qdrant rápidamente ganó popularidad debido a su facilidad de uso y a su documentación para desarrolladores intuitiva.


Qdrant está construido en el lenguaje Rust y proporciona API de cliente como Rust, Python y Golang para satisfacer las necesidades de los principales desarrolladores actuales. Sin embargo, Qdrant, como estrella en ascenso, todavía tiene ciertas lagunas con respecto a otros productos de la competencia, como una interfaz y funciones de consulta insuficientes.


Entonces, ¿cuál es la diferencia entre Qdrant y Zilliz Cloud/Milvus? Se puede entender que ambos están diseñados especialmente para datos vectoriales, pero son adecuados para diferentes escenarios. Qdrant es más adecuado para desarrolladores que buscan un mantenimiento de infraestructura de bajo costo. Si el sistema de aplicaciones presta más atención al rendimiento y la escalabilidad, Zilliz Cloud/Milvus es una opción más adecuada. Debido a que Zilliz Cloud/Milvus tiene las características de gran escalabilidad, mejor rendimiento y menor latencia, es adecuado para escenarios que tienen requisitos estrictos en cuanto a indicadores de rendimiento.


Este artículo dejará de lado estas diferencias superficiales y profundizará en las diferencias entre Qdrant Cloud y Zilliz Cloud comparando sus resultados comparativos de rendimiento y las características relacionadas con Qdrant Cloud.


01.

Qdrant Cloud vs Zilliz Cloud: competencia de rendimiento


Recientemente, a medida que el sistema de generación aumentada de recuperación (RAG) sigue siendo popular, los desarrolladores se han vuelto cada vez más confundidos acerca de "cómo elegir una base de datos vectorial". En las últimas semanas, hemos realizado una comparación detallada entre Qdrant Cloud y Zilliz Cloud en términos de rendimiento y capacidades de funciones.


Durante el proceso de comparación, utilizamos el conjunto de pruebas de rendimiento de código abierto VectorDBBench para realizar pruebas en torno a indicadores clave como consultas por segundo (QPS), consultas por dólar (QP$) y latencia.


[Gran conjunto de datos de prueba (≥ 5 millones de datos vectoriales)]


Los siguientes son los dos tipos de conjuntos de datos utilizados en la prueba:


  • El conjunto de datos 1 contiene 10.000.000 de datos vectoriales de 768 dimensiones.

  • El conjunto de datos 2 contiene 5.000.000 de datos vectoriales de 1.536 dimensiones.

  • Objeto de prueba


Los siguientes son los ejemplos utilizados durante las pruebas. Estos ejemplos son básicamente similares en la configuración del hardware:


  • Zilliz Cloud (8cu-perf): instancia de rendimiento de Zilliz Cloud 8 CU

  • Zilliz Cloud (2cu-cap): instancia de capacidad de Zilliz Cloud 2 CU

  • Qdrant Cloud (4c16g-5node): Qdrant Cloud 4 CPU 16G de memoria, usando instancias de 5 máquinas

  • Consultas por segundo (QPS)


Los resultados de la prueba muestran que al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, el QPS de las dos instancias de Zilliz Cloud es 7 veces y 1 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.



Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, el QPS de la instancia de Zilliz Cloud (8cu-perf) es 8 veces mayor que el de la instancia de Qdrant Cloud, pero el QPS de la instancia de Zilliz Cloud (2cu-cap) es inferior al de Qdrant Cloud instancia.



  • Consultas por dólar (QP$)


Al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 8 y 5 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.



Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 7 veces y 3 veces el de la instancia de Qdrant Cloud, respectivamente.



  • Demora


Al recuperar 10.000.000 de datos vectoriales de 768 dimensiones, las latencias P99 de las dos instancias de Zilliz Cloud son 1/12 y 1/3 de la instancia de Qdrant Cloud respectivamente.



Al recuperar 5.000.000 de datos vectoriales de 1.536 dimensiones, la latencia P99 de las dos instancias de Zilliz Cloud es 8 veces y 1 veces más rápida que la instancia de Qdrant Cloud, respectivamente.



[Conjunto de datos de prueba de tamaño mediano (<5 millones de datos vectoriales)]


Los siguientes son los dos tipos de conjuntos de datos utilizados en la prueba:


  • El conjunto de datos 3 contiene 1.000.000 de datos vectoriales de 768 dimensiones.

  • El conjunto de datos 4 contiene 500.000 datos vectoriales de 1.536 dimensiones.


  • Objeto de prueba


Los siguientes son los ejemplos utilizados durante las pruebas. Estos ejemplos son básicamente similares en la configuración del hardware:


  • Zilliz Cloud (1cu-perf): instancia de rendimiento de Zilliz Cloud 1 CU

  • Zilliz Cloud (1cu-cap): instancia de capacidad de 1 CU de Zilliz Cloud

  • Qdrant Cloud (4c16g-1node): Qdrant Cloud 4 CPU 16G de memoria, usando 1 instancia de máquina

  • Consultas por segundo (QPS)


Los resultados de la prueba muestran que al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, el QPS de las dos instancias de Zilliz Cloud es 2 veces y 1 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.



Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, el QPS de la instancia de Zilliz Cloud (1cu-perf) es 2 veces mayor que el de la instancia de Qdrant Cloud, pero el QPS de la instancia de Zilliz Cloud (1cu-cap) es menor que el de Qdrant Cloud instancia.



  • Consultas por dólar (QP$)


Al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 4 y 2 veces mayor que el de la instancia de Qdrant Cloud, respectivamente.



Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, el QP$ de las dos instancias de Zilliz Cloud es 3 veces y 1 vez mayor que el de la instancia de Qdrant Cloud, respectivamente.



  • Demora


Al recuperar 1.000.000 de datos vectoriales de 768 dimensiones, la latencia P99 de ambas instancias de Zilliz Cloud es 2 veces más rápida que la instancia de Qdrant Cloud.



Al recuperar 500.000 datos vectoriales de 1.536 dimensiones, la latencia P99 de las dos instancias de Zilliz Cloud es 127 veces y 27 veces más rápida que la instancia de Qdrant Cloud, respectivamente.



[Resultado: puntuación integral]



La figura anterior muestra la puntuación de rendimiento (escala porcentual) de cada instancia en diferentes casos de uso. Cuanto mayor sea la puntuación, mayor será el rendimiento. Los criterios de puntuación específicos se pueden encontrar aquí.

https://github.com/zilliztech/VectorDBBench/tree/main#leaderboard。



La figura anterior muestra la puntuación de rendimiento (>1) de cada instancia en diferentes casos de uso (https://zilliz.com/vector-database-benchmark-tool#comparison-section). Cuanto menor sea la puntuación, mayor será el rendimiento.


上述性能基准测试结果由开源的 VectorDBBench(https://github.com/zilliztech/VectorDBBench) 工具提供。在工具的 GitHub 主页上,还可以看到向量数据库的排行榜。VectorDBBench 为主流的向量数据库和相关云服务提供了公正的性能测试基准(https://zilliz.com.cn/benchmark)。该工具有着良好的易用性,可以轻而易举地在众多向量数据库云服务和开源向量数据库中找到最佳选择。


02.

Qdrant Cloud 特性对比


随着向量数据库可以存储的数据量呈几何级数的增长,性能也成为了向量数据库的重大挑战。为了保障数据检索性能,数据库的跨节点横向扩展能力至关重要。另外,数据插入速率、检索速率以及底层硬件的不同可能会衍生出不同的应用需求,这也让全局参数调节能力成为向量数据库的必备能力之一。


  • 向量数据库为何而生


向量数据库是用来存储通过机器学习模型生成的非结构化数据的向量表示,为其创建索引,并在其中进行检索的一套全托管解决方案。它应该提供如下特性:


  • 可扩展性和参数调节能力

  • 多租户和数据隔离

  • 完整的 API 套件

  • 直观的用户界面和控制台

  • 可扩展性



  • 功能


  • 专门打造



关于更多详情,请参见比较页面(https://zilliz.com.cn/comparison/milvus-vs-qdrant)。


推荐阅读



本文分享自微信公众号 - ZILLIZ(Zilliztech)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

阿里云严重故障,全线产品受影响(已恢复) 汤不热 (Tumblr) 凉了 俄罗斯操作系统 Aurora OS 5.0 全新 UI 亮相 Delphi 12 & C++ Builder 12、RAD Studio 12 发布 多家互联网公司急招鸿蒙程序员 UNIX 时间即将进入 17 亿纪元(已进入) 美团招兵买马,拟开发鸿蒙系统 App 亚马逊开发基于 Linux 的操作系统,以摆脱 Android 依赖 Linux 上的 .NET 8 独立体积减少 50% FFmpeg 6.1 "Heaviside" 发布
{{o.name}}
{{m.name}}

Supongo que te gusta

Origin my.oschina.net/u/4209276/blog/10142196
Recomendado
Clasificación