バレルポイントHIVEのチューニング

  • 樽ルールポイント

    • サブバレルフィールド値のバケットにおける残りと同じであるバレルの残りの数、バケット内のレコードを決定したの残りの部分で割ったハッシュ値をハッシュ

  • ポイント利点バレル

    1. 効率を改善するクエリに参加します:

      テーブルAとBは、加入IDフィールド条件に参加するために仮定されます。

      • 大きなテーブルのための二つのテーブル

      • 2つの表は、バケットリストを分割しています

      • バケットの数は、表Bまたは表浴槽因子の数の倍数であります

      そうクエリ時間の参加、表Aおよび表Bの各バケットは、直接対応するバレルに参加することができ、代わりに、テーブル全体は、結合、クエリ効率を向上させます

    2. サンプリング効率を高めます

      • バレルの後ろのポイントテーブルには、バンドは、サブバレルフィールドではない場合、フィールド名にデフォルトをもたらすことはできませんもたらす可能性があります、しかし、あなたが持参しなければならないというサブバレルテーブル

      • パーティションテーブルは、表比較的大きな増加サンプリング効率のデータを取得するためにバケツの対応するバケットに直接移動するため、サブバレルフィールドによってサンプリング時

おすすめ

転載: www.cnblogs.com/xiangyuguan/p/11416043.html