「ハイブプログラミングガイド」の研究ノート|記事はハイブデータタイプとファイル形式を読み込みます

  ハイブは、リレーショナルデータベース内のデータの最も基本的なタイプをサポートしていますが、また、めったに発生しないリレーショナルデータベースのデータ収集の3種類をサポートしています。そして、ほとんどのデータベースに比べて、ハイブは、ファイル内のデータ符号化のための大きな柔軟性を持っているユニークな機能を持っています。ほとんどのデータベースは、データを含め、完全に制御していたディスクの制御プロセスに格納されたデータだけでなく、データのライフサイクルの制御をハイブユーザーにこれらの領域の制御は、それが簡単に、ユーザーがデータを操作するためのさまざまなツールを管理し、使用するために作ります。

 

まず、  基本データ型

表1-1ハイブ基本データ型

データの種類

長さ

TINYINT

1バイトの符号付き整数

20

SMALINT

2バイトの符号付き整数

20

INT

4バイトの符号付き整数

20

BIGINT

8バイトの符号付き整数

20

BOOLEAN

trueまたはfalseのブール、

TRUE

浮く

単精度浮動小数点数

3.14159

ダブル

倍精度浮動小数点数

3.14159

STRING

文字のシーケンス。あなたは、文字セットを指定することができます。これは、単一または二重引用符かもしれ

「すべての良い男性のため」、「今の時間です」

TIMESTAMP(v0.8.0の+)

整数、浮動小数点数または文字列

1327882397(Unixの時代秒)、1327882397.123456789(Unixの秒数ナノ秒の新たな時代が続いている)と '2019-09-0912:34:56.123456789'(互換性JDBCをjava.sql.Timestampです)

BINARY(v0.8.0の+)

バイト配列

下記を参照してください。

 

ハイブのJavaの対応するタイプのデータ・タイプと実質的に一致します

  ハイブ基本データ・タイプは、インタフェース上でJavaで実装されているので、これらのタイプと対応するJavaタイプの特定の詳細の動作は全く同じです。

 

2.ハイブは、タイプ「文字列」の最大長を制限するサポートしていません

  このタイプをサポートしているリレーショナルデータベースは、固定長レコード容易インデクシング、データスキャンので、パフォーマンス上の理由のために最適化されています。

  「ゆるい」ですハイブ世界が、それは必ずしもデータファイルはありませんが、異なるファイル形式の使用をサポートすることができなければなりません。異なるフィールド間のその決意セパレータに従ってハイブ。同時に、読み出しおよび書き込み、および列値の長さを制限するために、ディスクのパフォーマンスを最適化する上でのHadoopとハイブ重点は、比較的重要ではありません。

おすすめ

転載: www.cnblogs.com/JasonCeng/p/11495074.html