「Vector Database Guide」 - Milvus Cloud2.0 の設計プロセス全体で最初から考慮されたいくつかの重要なポイント

まず、スケーラビリティを実現する方法を検討します。

次に、弾力性やデータ分離など、クラウド ネイティブまたはデータベースに重点を置く際の重要なポイントを検討しました。バージョン 1.0 では、ユーザーがインデックスを構築するときにクエリのパフォーマンスが相互に影響するためです。したがって、私たちの目標は、インデックスの構築とクエリを効果的に分離することです。3 番目の考慮事項は、データのリアルタイム性です。バージョン 1.0 では、一貫性保証が弱いため、ユーザーの 1 人が大量のデータを挿入しましたが、クエリ時にそのデータが見つかりませんでした。私たちはトラブルシューティングに多くの時間を費やしましたが、最終的に、挿入されたデータのインデックス作成が間に合わず、オンラインで提供できず、ユーザーがそのことにまったく気づいていないことがわかりました。

このため、バージョン 2.0 の構築では、ユーザーがデータを挿入してからすぐに使用できるように、リアルタイム性を重視しましたが、理想的な状態は、当然、強力な整合性、つまり、書き込んだ後すぐにクエリできることです。ただし、シナリオによっては、ある程度の遅延は許容できますが、保護は不可欠です。そのため、バージョン 2.0 では、データの更新と削除の方法を含む、ストリーミング データの書き込み機能、ストリーミング データと従来のバッチ インポート データを組み合わせる方法の開発に多大な労力を費やしました。これらの問題は、バージョン 2.0 では、特にクラウドネイティブ アーキテクチャの下では非常に複雑になっています。データ レイクに関連する問題は誰もが多かれ少なかれ認識していますが、初期の製品には更新と削除の機能がありませんでしたが、これらの機能は後に導入されました。したがって、バージョン 2.0 の設計は、リアルタイムの問題を解決する方法に重点を置いています。

2021 年 6 月頃、最初のリリースをリリースしました。

おすすめ

転載: blog.csdn.net/qinglingye/article/details/132832291