このドキュメントは、GBase 8aクラスタに初めてアクセスするユーザーに適しています。862Build43バージョンに基づいて、インストール、テーブルの構築、ストレージ、エクスポートなどの最も一般的な操作を紹介しています。GBase 8aデータベースクラスターの初心者ユーザー向けの入門ガイドです。
元のアドレス http://www.gbase8.cn/1433 も私自身のものです。
1。概要
このドキュメントでは、NTU General GBase 8a MPPクラスター(以下、8aクラスターと呼びます)のインストール、簡単な使用、操作、およびメンテナンスについて紹介します。対象読者は、8aクラスターを初めて使用する開発者とデザイナーです。
本資料は基本的な使い方のみを紹介したものであり、一部の機能の詳細については製品マニュアルをご確認ください。
このドキュメントには、Redhat 7上の8aクラスターV8の操作例のみが含まれています。
1.1大会
ファーストネーム | 説明 |
管理ノードgclusterノード | 調整ノード、コーディネーターノードは、外部へのサービスの提供、実行計画の分析と発行に使用されるノードです。gclusterディレクトリとgclusterdプロセスが含まれています。管理ノードは、実際のデータではなく、テーブル構造のみを保存します。小規模クラスターでは、管理ノードとデータノードを同じマシンにデプロイできます。 |
データノードgnodeノード | データの保存と特定のSQLの実行を担当するノード。小規模クラスターでは、管理ノードとデータノードを同じマシンにデプロイできます。 |
調整ノードgcwareノード | クラスターの整合性を担当するサービス。 |
DBAユーザーdbaUser | データベースインストールのオペレーティングシステムユーザー、通常はgbase |
2環境の準備
この章では、単純な[トライアル] 8aクラスターに必要な環境を紹介します。詳細な環境要件については、製品マニュアルのインストール部分を参照してください。
2.1マシン数
仮想マシンを含めて1つで十分です。このドキュメントには紹介コンテンツのみが含まれています。パフォーマンステストまたは高可用性テストを実行する必要がある場合は、少なくとも3台のサーバーを準備してください。
2.2オペレーティングシステム
このドキュメントでは、互換性のあるcentos 7、cgsl5などを含む、redhat7バージョンでの操作例を提供します。
推奨される最小メモリは4Gです。並行テストなどを行う場合は、16G以上をお勧めします。
データ状況に応じてディスク容量を設定してください10G以上、ルートディレクトリの空き容量は2G以上を推奨します。
オペレーティングシステムのルートパスワード。sudoユーザーによるインストールをサポートしていますが、必要に応じて製品のインストールマニュアルを参照してください。
このマシンの外部IP、この例では、10.0.2.106はipv4アドレスです。
ファイアウォールをオフにします。
2.3データベースのバージョン
8aクラスターバージョンのインストールパッケージを他のソースから入手していない場合は、次のような公式Webサイト(www.gbase8a.com)から無料バージョンをダウンロードできます。
GBase8a_MPP_Cluster-NoLicense-FREE-8.6.2_build43-R7-redhat7.3-x86_64.tar.bz2
その中でも、RHEL7.3はredhat 7オペレーティングシステムで実行する必要性を表しています。
x86_64は、x86に常駐する64ビットCPUを表します。
8.6.2は製品のメジャーバージョン番号です。
Build43-R7はマイナーバージョン番号です。
3インストール
この章では、8aクラスターの簡単なインストール手順を紹介します。目標は、データベースとテーブルを構築できる環境です。
3.1アップロード
/ rootの下にある1つのサーバーにインストールパッケージをアップロードします。複数ある場合は、いずれか1つにアップロードします。
3.2解凍
現在の場所で解凍します。
tar xvf GBase8a_MPP_Cluster-NoLicense-FREE-8.6.2_build43-R7-redhat7.3-x86_64.tar.bz2
3.3構成
gcinstallディレクトリに入ります
cd gcinstall
設定ファイルを編集
vi demo.options
編集した構成ファイルは次のとおりです(#で始まる行は無視してください)。
次の赤いパラメーターを変更する必要があります。
installPrefixはインストールディレクトリです。
座標ホストは、今回インストールされたマシンのIPアドレスです。
ipv6アドレスに使用されるordinateHostNodeIDを、ipv6の最後の部分と同じになるように変更します。繰り返すことはできません。ipv4は無視できます。
loginUserオペレーティングシステムのログインユーザー名この例では、rootユーザーが使用されます。
loginUserPwdオペレーティングシステムにログインするユーザーのパスワード、この場合はrootユーザーのパスワード。
dbaUserデータベースで使用されるオペレーティングシステムユーザー。デフォルトはgbaseです。
dbaGroupデータベースで使用されるオペレーティングシステムユーザーのユーザーグループ。デフォルトはgbaseです。
dbaPwdデータベースが使用するオペレーティングシステムユーザーのパスワード。
rootPwdオペレーティングシステムのユーザーrootのパスワードこの例では、前のloginUserPwdと同じです。
次の構成は無視されます
3.4インストール
実施した
./gcinstall.py --silent=demo.options
ライセンス契約のセクションにyと入力してEnterキーを押します
システムチェックが成功したら、文字yを入力し、インストールを確認するときにEnterキーを押します。
インストールが完了するまで待ちます
インストール結果を確認する
gcadmin
インストール直後に上記のコマンドを実行してエラーを報告した場合、10秒待ってから再試行できます。
3.5配布戦略を設定する
配布戦略のxmlファイルを編集します。デフォルトのインストーラーは、現在のディレクトリにgcChangeInfo.xmlを生成します
vi gcChangeInfo.xml
内部のノードipは、新しくインストールされたクラスターのIPです。この例では、これを変更しません。
オペレーティングシステムのgbaseユーザーに切り替えます
su gbase
ディレクトリが変更された場合は、インストーラーディレクトリに移動してください。
新しいデータベース分散戦略
gcadmin distribution gcChangeInfo.xml p 1 d 0
その中で
distributionは、新しい配布戦略を作成するコマンドです。
gcChangeInfo.xmlは、配布戦略構成ファイルを受け取ります。
pはノードあたりのシャードの数です。1に設定します。
dはレプリカの数です。この例は単一ノードなので、レプリカの数は0です。複数のノードがある場合は、1に設定できます。
文字yを入力し、確認時にEnterキーを押します
次のコマンドを使用して、クラスター分散戦略が有効かどうかを確認します
gcadmin showdistribution
右半分の複製セグメントノードIPは複製のIPです。複製がないため、空です。
3.6初期化
コマンドラインクライアントを使用してクラスターにログインする
gccli
次のコマンドを実行します
initnodedatamap;
この時点で、データベースはインストールされており、正式にサービスを提供できます。
4ビジネスの初期化
このパートでは、データベースの最も基本的な操作、データベースの作成、テーブルの作成、データの挿入、クエリについて紹介します。
4.1データベースを作成する
次のコマンドを実行して、指定した名前のデータベースを作成します。
create database testdb;
testdbデータベースに切り替える
use testdb;
4.2テーブルを作成する
テーブルを作成するには、次のフィールドを含む個人名テーブルを設定するだけです。
IDスタッフ番号、整数
名前、varchar
joinDate参加日、日付
給与給与、小数
create table human(id int,name varchar(100),joindate date,salary decimal(10,2));
現在のライブラリにあるテーブルを表示する
show tables;
テーブル作成ステートメントの表示
show create table human;
テーブル構造を見る
desc human;
作成したテーブルが正しいことを確認します。
4.3データを挿入する
insertメソッドを使用して、3行のデータを挿入します。
insert into human values(1,'张三','2000-01-02','30000');
insert into human values(2,'李四','2003-03-04','20000');
insert into human values(3,'王五','2008-05-06','15000');
4.4クエリ
selectステートメントを使用して、データベースに保存したデータをクエリします。
select count(*) from human;
select * from human where id=1;
select * from human where salary>=20000;
5ローディング
8aクラスターの単一挿入のパフォーマンスは非常に低いため、最高は1秒あたり数十から数千の挿入です。ビッグデータ(1,000行を超える場合に推奨)のもとでは、バッチで読み込まれ、保存されます。
この部分は、8aクラスターの読み込み機能のデモにのみ使用されます。パフォーマンスに不安がある場合は、ビジネステーブルとビジネスデータを自分で作成してテストしてください。
5.1構造データ
数行のデータを手動で作成しました。ファイルは/home/gbase/human.txtです
[gbase@localhost ~]$ cat human.txt
1,First,2012-12-23,10000.12
2,Second,2013-11-12,8888.88
3,中国人,2019-08-09,9999.99
[gbase@localhost ~]$ pwd
/home/gbase
5.2積み込みと倉庫保管
このロードは、sshベースのsftpを使用して保存するためのデモ用です。パフォーマンスをテストするには、ftp、hdaoop、およびその他のプロトコルを使用してください。
load data infile 'sftp://gbase:[email protected]/home/gbase/human.txt' into table testdb.human fields terminated by ',';
データソースはsftp形式を使用します
sftp://gbase:[email protected]/home/gbase/human.txt
ストレージターゲットはtestdb.humanです。
フィールドはフィールドのいくつかの定義を表します。ここでは、フィールド間のセパレーターのみが単一引用符に設定されています。
terminated by ','
5.3他のいくつかのプロトコルの読み込みサンプルは次のとおりです
ftp:// gbaseload:[email protected]/2.csv
ftp:// gbase:[email protected]//home/gbase/data/a.tbl
sftp:// gbase:[email protected]/data/a.tbl
hdp://[email protected]:50070 / data / test.tbl
http://www.gbase8.cn/?p=121を参照して ください
6エクスポート
データベースのデータをPingyuan形式のデータファイルとしてエクスポートします。
次の例は、コンマ区切りの例です
select * from human into outfile 'sftp://gbase:[email protected]/home/gbase/human_out.txt' fields terminated by ',';
パラメータはロードと同じです。
デフォルトでエクスポートすると、エクスポートされたファイルと同じディレクトリが作成されます。たとえば、human_out.txtとしてエクスポートされます。これは実際にはXXX / human_out.txt / human_out.txtです。
上記の通り合格
set gbase_export_directory=0;
エクスポート時に、生成されたディレクトリのパラメータをオフにします。