1.1はじめに
Apache Hiveデータウェアハウスソフトウェアは、SQLを使用して分散ストレージにある大規模なデータセットの読み取り、書き込み、および管理を容易にします。 構造は、すでにストレージにあるデータに投影できます。ユーザーをHiveに接続するためのコマンドラインツールとJDBCドライバーが提供されています。
Apache Hiveデータウェアハウスソフトウェアは、SQLを使用して、分散ストレージにある大規模なデータセットの読み取り、書き込み、管理を簡単に行うことができます。構造は保存されたデータに投影できます。ユーザーをHiveに接続するためのコマンドラインツールとJDBCドライバーが提供されています。
1.2機能
SQLをMapReduceプログラムに変換し、プログラムをYARNクラスターに送信し、HDFSでデータ処理を読み取ります。
S QLクエリ:MySQLのようなSQLデータベース
1.3コンセプト
Hadoop上のSQL
Faction:Hadoop上に構築されたSQLベースの分析フレームワーク
H 私はこのタイプのフレームは、フレームのベースフレームであるVE
Mは、DDLとDMLをYSQL
M AP:セグメンテーションと変換
(hadoop、1)、hive、1)、spark、1).....
R&LT educe:加算
DML DDL DCLの違い
DML(データ操作言語):
それらはSELECT、UPDATE、INSERT、DELETEであり、その名前と同様に、これらの4つのコマンドは、データベース
DDL(データ定義言語)内のデータを操作するために使用されます 。DDL
はDMLよりも多く、主要なコマンドはCREATE、ALTER、DROPなど。DDLは主に、テーブルの構造(TABLE)、データ型、テーブル間のリンクと制約、およびその他の初期化作業を定義または変更するために使用され、それらのほとんどはテーブルの作成時に
DCL(データ制御言語)を使用します。 :
データベース管理機能です。(許可、拒否、取り消しなどの)ステートメントを含む、データベースユーザーまたはロールのアクセス許可を設定または変更するために使用されるステートメント。デフォルトでは、sysadmin、dbcreator、db_owner、またはdb_securityadminなどの担当者のみがDCLを実行する権限を持っています
1、DDL
1-1。DDLの概要
DDL(データ定義言語)は、オブジェクトやオブジェクト属性を操作するために使用されます。このようなオブジェクトには、データベース自体だけでなく、テーブルやビューなどのデータベースオブジェクトも含まれます。DDLはこれらのオブジェクトと属性を扱います作成、削除、変更における特定のパフォーマンスの管理と定義。特別な注意:DDL操作での「オブジェクト」の概念、「オブジェクト」にはオブジェクトとオブジェクトの属性が含まれ、オブジェクトはレコードより少なくとも1レベル大きいです。例としてテーブルを取り上げます。Createはデータテーブルを作成し、Alterはテーブルのフィールドを変更できます。Dropはテーブルを削除できます。ここから、DDLステーションの高さを確認できます。彼は特定のデータを操作しません。
1-2。DDLのメインステートメント(操作)
Createステートメント:データベースとデータベース内のいくつかのオブジェクトを作成できます。
Dropステートメント:データテーブル、インデックス、トリガー、条件付き制約、およびデータテーブルの権限を削除できます。
ステートメントの変更:データテーブルの定義と属性を変更します。
1-3。DDLの操作オブジェクト(テーブル)
1-3-1。
テーブル作成の概念は、データを格納するために使用されます。格納するデータは利用できないため、管理を容易にするためにいくつかのデータ型を定義する必要があります。
1-3-2。テーブル属性
主キー属性:主キーは主キー制約ですが、名前は異なり、主キー名は仮想に偏っています(つまり、これについて説明しています)、主キー制約名は実際に偏っています(つまり、操作の実装を説明しています)、すべて説明されていますそれは同じことです。主キー制約はテーブル内の属性です。テーブルには最大で1つの主キーが存在できます。主キーは1つ以上のフィールドで定義できます。主キーは、1つ以上のフィールドの値が一意であり、空ではないようにする必要がありますこのようにして、このフィールドまたはフィールドのグループの値を使用して、レコードを一意に表すことができます。
一意の属性:テーブルに含めることができる主キー属性は1つだけです。正方形のテーブルユーザーの場合、一意の制約が提案されます。一意の制約は1つ以上のフィールドで定義できます。一意の制約は、フィールドまたはフィールドグループの値を一意にし、空ですが、繰り返すことはできません。
外部キー属性:外部キーとも呼ばれ、外部キー制約とも呼ばれ、主キーと主キー制約の関係は同じです。テーブルAの主キーがテーブルBのフィールドである場合、外部キー制約の対象となる2つのテーブル、このフィールドはテーブルBの外部キーと呼ばれ、テーブルAはマスターテーブルと呼ばれ、テーブルBはスレーブテーブルと呼ばれますが、コンピュータがこの関係にあることを知っている必要があります。
検証、Null、およびデフォルト属性:検証属性は検証制約とも呼ばれ、Null属性はNull制約とも呼ばれ、デフォルト属性はデフォルト制約とも呼ばれます。これらの名前は事物を説明し、状況を説明します。もちろん、意図的に人為的に行うこともできますが(入力データは注意を払うためのものです)、本来の目的は自動化を実現すること、つまりコンピューターにこれを行わせることです。
(主キーと一意制約が自動的に作成される理由を知っていますか?インデックスは自動的に作成されますか?それは一意インデックスです。インデックスは主にこれらのフィールドで使用されていると考えてください。インデックスの役割は知っています。主キー制約と同様に、一意制約、Null以外の制約、外部キー制約、チェック制約、およびデフォルト制約はすべて、テーブルに特定の特性を持たせる操作であるため、ここではそれらがすべてテーブルの属性であると考えています。)
2. DML
2-1。DMLの概要
DML(データ操作言語)は、データベースオブジェクトに含まれるデータを操作するために使用されます。つまり、操作の単位はレコードです。
2-2。DMLのメインステートメント(操作)
Insertステートメント:レコードをデータシートに挿入します。
Deleteステートメント:データテーブル内の1つ以上のレコードを削除します。データテーブル内のすべてのレコードを削除することもできますが、その操作オブジェクトはレコードのままです。
更新ステートメント:テーブルに既に存在するレコードの内容を変更するために使用されます。 2-3。DML
レコードの操作オブジェクト
2-3-1。注レコード
に対して挿入、削除、更新操作を実行するときは、レコードに注意を払い、DDLのいくつかの操作について明確にする必要があります。
3. DCL
3-1。DCLの概要
DCL(Data Control Language)の操作はデータベースオブジェクトの権限であり、これらの操作を決定することでデータの安全性を高めます。
3-2。DCLのメインステートメント(操作)
Grantステートメント:オブジェクトの作成者がユーザーまたはグループまたはすべてのユーザー(PUBLIC)に特定の権限を与えることを許可します。
ステートメントの取り消し:ユーザー、グループ、またはすべてのユーザーのアクセス権を取り消すことができます
3-3。DCLの操作オブジェクト(ユーザー)は
、データベースユーザーを参照します。