データテーブルの上にテーブルと操作のハイブを作成します。

二つのテーブルにハイブA、

  図1に示すように、内部テーブル(管理テーブル):

      ときHDFSテーブル上のデータを削除するには削除します。

  2、外部表

      テーブルを削除しないときは、HDFS上のデータを削除。

      外部表には、すべてのデータソースが外部の人によって提供され、データINSERT使用して挿入することができないので、これは、ハイブが、彼らはハイブテーブルを削除し、排他的なデータを持っていないと思いますが、テーブルには、データの内部には削除されません。

第二に、ハイブのデータテーブルの操作;

  1、一般への挿入強く、それは、上記のHDFSにHDFSのメタデータ管理の影響を小さなファイルが生成されますので、このようにデータを挿入することは推奨されません

  テーブルの構成は、あなたが区切り文字を使用しない場合とき2、ハイブ、\ 001昇順コードがデフォルト値、非印字文字です。

  図3に示すように、テーブルを作成するときに区切り文字を指定

    内部テーブルを作成します。

    ずSTU2は、(ID int型、名前の文字列)「\ T」テキストファイルの位置として記憶「/ユーザ/ハイブ/倉庫/ myhive / STU2」によって終了行形式区切りfileds存在する場合、テーブルを作成します。

    外部表を作成します。

    ない「\ t」のテキストファイルの位置として記憶 '/ユーザ/ハイブ/倉庫/ myhive /学生によって終了学生(S_IDストリング、s_name列)行形式区切られたフィールドが存在する場合は、外部表を作成します。

  図4は、クエリの結果に基づいてテーブルを作成し、新しいテーブルへのデータのクエリの結果は、内部に行きます

      STU2から選択*としてテーブルstu3を作成し、このように多くのの使用

      よると、既存のテーブル構造のテーブルを作成するには、ちょうどこのように、テーブルの構造をコピーします。

      STU2のようなテーブルstu4を作成します。

  5、ルックアップテーブルのタイプ:

    DESCフォーマットさSTU2。

  6、どのように内部、外部表にデータをロードするには?

   1、データはテーブルにローカルファイルシステムからロードされます

     テーブルの学生への負荷データのローカルINPATH「/export/servers/hivedatas/student.csv」;

     負荷データと上書き既存のデータ

     テーブルの学生への負荷データのローカルINPATH「/export/servers/hivedatas/student.csv」上書き。

   図2に示すように、HDFSは、(必要なテーブルデータをファイルシステムからロードしたデータをアップロードするために、事前に、実際には、HDFSファイルシステムモバイルオペレーティングファイル)

    テーブルtecherへの負荷データINPATH「/hivedatas/techer.csv」;

 

  

おすすめ

転載: www.cnblogs.com/nacyswiss/p/12606983.html