"벡터 데이터베이스 가이드" - AI 기본 벡터 데이터베이스 Milvus Cloud 2.3 개선

상승

  • MMap 기술로 데이터 용량 증가

MMap은 Linux 커널에서 제공하는 기술로 디스크 공간의 일부를 메모리에 매핑할 수 있는데, 이렇게 하면 데이터를 로컬 디스크에 로드한 후 디스크를 메모리에 mmap하여 단일 머신 데이터의 용량을 늘릴 수 있습니다. MMap 기술을 사용하여 테스트한 결과 데이터 용량은 2배로 증가하고 성능 저하가 20% 이내로 전체 비용이 크게 절약됩니다. 비용에 민감한 사용자는 이 기능을 사용해 볼 수 있습니다.

  • 필터 씬 성능 개선

스칼라 벡터의 혼합 쿼리 시나리오의 경우 Milvus의 실행 계획은 스칼라 필터링을 먼저 수행한 다음 벡터 검색을 수행하는 것으로, 이는 스칼라 필터링 후에 많은 양의 데이터가 필터링된다는 것을 의미합니다. 벡터 인덱스 성능 이 시나리오의 성능은 HNSW 인덱스의 데이터 필터링 전략을 최적화하여 2.3.0에서 최적화되었습니다. 또한 수동 벡터화 실행 기술 도입을 통해 스칼라 데이터 필터링 속도도 크게 향상됐다.

  • 성장 지수

Milvus 데이터는 인덱스 데이터와 스트리밍 데이터라는 두 가지 범주로 나뉩니다. 인덱싱된 데이터의 경우 자연스럽게 인덱스를 사용하여 쿼리 속도를 높일 수 있지만 스트리밍 데이터는 행 단위로만 검색할 수 있으므로 성능에 영향을 미칩니다.

Supongo que te gusta

Origin blog.csdn.net/qinglingye/article/details/132719716
Recomendado
Clasificación