読み取りカタログ
zhjによって追加:最後にラインストレージとは何か、柱状のストレージが何であるかを理解しています。これは、関連する記憶媒体にデータ構造が格納されています
列記憶手段、記憶媒体にデータを連続的に記憶されている、記憶媒体に一列にデータ保存列を指し
これは、連続して格納されます。簡単に言えば、あなたは、各列とみなさデータベースは、このような一つだけのテーブルである柱状することができます
列内のみのクエリ条件ならば、すぐにスピード。
これら二つの異なるストレージ・メソッドはCRUDどのようなデータその上に異なる効果を持っていること?、いくつかの記事を読みます
一般的には、以下の2点と言いました
1。カラム逆データベース、いくつかの列、行の大部分を読み出す手段と、データベース内の行は、複数の列が少ないラインを読み出すように適合されています。
2。スペースを節約するために、データベース内の列、そうでない場合は、列、列に格納されたデータの行は、あなたが列の値を格納することはできません。
この省スペースデータベース内の行よりも、
私は個人的に、列データベースがあるため、クエリの条件は、マルチコンディションコンビネーション問い合わせのフィールドいくつかの列には適していません、単一の列にのみ適していると感じ
各列のクエリが独立しており、各列は単一のデータベーステーブルに相当し、各列のクエリ結果があればよいです
接続に参加し、結合条件を等しくrow_keyであるが、クエリ結果セットの各行は、重要であり得ます。場合は、スライスへのデータの我々の列、
第1ソートキー、および断片化により、一般的に、別のマシンに保存されているとき。額、ビット混沌。HBaseのは、それごとに例です
ときに我々列番号、それは実際にソート行キーの、この利点は、行キーの範囲内で、マシン上に配置することができています
行キーを持つクエリは、データを素早く見つけることができるとき。私は、クエリのフィールドストリップとして別の列を使用したい場合はHBaseのは、何のセカンダリインデックスではありません
全表スキャンになり部品、。これは、データベース上記第二の点の一見カラム唯一の利点を現われます
オリジナルます。http://blog.csdn.net/dc_726/article/details/41143175
最近、私はいくつかの図面を伴ういくつかの単語に柱状ストレージ(カラムベースのストレージを)置く非常に良い情報を、見た自分が、Niuaを明らかにしました!お気に入りは、この理解しやすい背景知識がかなり長いったらしいの概念について話よりも、はっきりプットを話すです。
1なぜYaoan列ストア
用ラインストレージ従来のリレーショナル・データベース(行-basedstorage)に対する記憶カラム(柱状または列ベース)。簡単に言えば2つの違いは、(翻訳がオリジナルの良い、直接のコピーではありません)テーブルを整理する方法です。
Ø行ベースのストレージ格納行の順序でATABLE。
列の配列中のO列ベースのストレージstoresaテーブル。
例で見てみましょう:
はっきり図から分かる、テーブルストレージのデータ行が一緒に入れているが、ストレージの列が個別に保存されています。以下のこれらの利点と欠点を持っている彼らはとても:
|
ラインストレージ |
柱状ストレージ |
利点 |
Øデータを一緒に保存されます ØINSERT / UPDATE簡単 |
それは、クエリに来るときØ列のみが読み込まれます Øプロジェクション(投影)非常に高いです Ø任意の列は、インデックスとして使用することができます |
短所 |
Ø選択(セレクション)だけでもいくつかの列を含む場合、すべてのデータも読み込まれます |
選択が完了するとØは、選択された列は、再組み立てします ØINSERT / UPDATEたくさんの悩み |
注:リレーショナルデータベース理論のレビュー - セレクト(選択)と投影(プロジェクション)
2添加:データ圧縮
圧縮されたデータディクショナリ表:実際には、今述べた別の技術的なデータをスキップします。また、通過言及の一部であり、後者の態様を説明します。
ここではリストの元の外観に行くです。データ辞書テーブルを圧縮した後、文字列テーブルは、数値になっていました。各文字列が辞書テーブルに一度だけ表示され、その圧縮の目的を達成するため、(標準と非標準ノーマライズとDenomalizeのようなビット)
3クエリの実行パフォーマンス
ここで図は、ストレージ列(並びにデータ圧縮)の利点を説明するためクエリプロセスによって行わ最も牛です。
次のように重要なステップは以下のとおりです。
1.辞書テーブルには、(文字列比較を一度だけ実行される)に対応する数値文字列を検索します。
番号1に一致セット上の位置と一致するように前記リスト。
3ビット操作インデックスの異なる列のマッチング結果は、全ての条件で記録されています。
4.添字は、最終的な結果セットを組み立てました。