目次
Apache Supersetは、複数のデータソースに接続できるオープンソースの最新の軽量BI分析ツールであり、豊富なアイコン表示フォームを備え、カスタムダッシュボードをサポートし、非常に使いやすい使いやすいユーザーインターフェイスを備えています。
1.スーパーセットアプリケーションのシナリオ
Supersetは、Hive、Kylin、Druidなどの一般的に使用されるビッグデータ分析ツールとインターフェイスでき、カスタムダッシュボードをサポートするため、データウェアハウスの視覚化ツールとして使用できます。
2.スーパーセットのインストール
スーパーセットの公式ウェブサイトアドレス:https://superset.apache.org/
2.1Python環境をインストールする
SupersetはPython言語で記述されたWebアプリケーションであり、Python3.6環境が必要です。
2.2Minicondaをインストールする
Condaが可能なオープンソースのパッケージと環境マネージャで異なるバージョンのPythonをインストールするために使用さパッケージとその依存関係のを同じマシン上で、異なるPythonの環境を切り替えることができます。Anacondaは、このような、Conda、パイソン、インストールされているツールキットの多くを含んでいますとして:numpy、pandasなど、MinicondaにはConda、Pythonが含まれます。
2.2.1 Minicondaのダウンロード(Python3バージョン)
ダウンロードリンク:https://repo.anaconda.com/miniconda/ Miniconda3-latest-Linux-x86_64.sh
2.2.2Minicondaをインストールします
-
Miniconda3-latest-Linux-x86_64.shを/ opt / module /パス(/ opt / module /ファイルを配置するディレクトリ)にアップロードします
-
次のコマンドを実行してインストールし、インストールが完了するまでプロンプトに従います。
bash Miniconda3-latest-Linux-x86_64.sh
-
「はい」または「いいえ」と答えるまでEnterキーを押し続けます。
Please answer 'yes' or 'no':'
>>> yes
-
次の>>>は、インストールパスを指定することです(ユーザーのニーズに応じて指定):/ opt / module / miniconda3
>>> /opt/module/miniconda3
-
Miniconda3を初期化するかどうか、yesと入力します
Do you wish the installer to initialize Miniconda3
by running conda init? [yes|no]
[no] >>> yes
-
次の単語が表示されたら、インストールは完了です
Miniconda3をインストールしていただきありがとうございます。
2.2.3環境構成ファイルをロードして有効にします
-
環境変数を構成する
sudo vim /etc/profile.d/my_env.sh
次のコンテンツを追加します
export CONDA_HOME=/opt/module/miniconda3
export PATH=$PATH:$CONDA_HOME/bin
-
環境変数を取得するか、仮想マシンに接続されているクライアントを再起動します
source /etc/profile.d/my_env.sh
2.2.4基本環境を非アクティブ化する
Minicondaをインストールすると、ターミナルを開くたびにデフォルトの基本環境がアクティブになります。次のコマンドを使用して、デフォルトの基本環境のアクティブ化を無効にできます。
conda config --set auto_activate_base false
2.3 Python3.6環境を作成する
2.3.1 conda国内ミラーの構成(清華)
#分别输入
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --set show_channel_urls yes
2.3.2 Python3.6 環境を作成する
conda create --name superset python=3.6
説明:
- conda環境管理の一般的なコマンド
- 環境の作成:conda create -n env_ name
- すべての環境を表示:conda info --envs
- 環境を削除します:conda remove -n env _name --all
2.3.3 スーパーセット環境をアクティブ化する
conda activate superset
アクティベーション後の効果を下図に示します。
説明: 現在の環境を終了します:conda deactivate
2.3.4 pythonコマンドを実行して、pythonバージョンを表示します
python
2.4スーパーセットのインストール
2.4.1 スーパーセットの依存関係をインストールする
#第一个
sudo yum install -y python-setuptools
#第二个
sudo yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel
2.4.2 setuptoolsとpip(douban)のインストール(更新)
pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/
注: pipはPythonパッケージ管理ツールであり、centosのyumと比較できます。
2.4.3 Supetsetをインストールします。
ip install apache-superset -i https://pypi.douban.com/simple/
-iの役割はミラーを指定することです。これが国内のミラー(douban)です。
2.4.4 Supetsetデータベースの初期化(Supets etは独自のデータベースを備えたWebアプリケーションであり、初期化する必要があります)
superset db upgrade
2.4.5管理者ユーザーの作成(カスタム)
flask fab create-admin
Username [admin]: hadoop
User first name [admin]:
User last name [user]:
Email [[email protected]]:
Password: ******
Repeat for confirmation:
2.4.6スーパーセットの初期化
superset init
2.5スーパーセットを開始する
2.5.1gunicornをインストールします
pip install gunicorn -i https://pypi.douban.com/simple/
2.5.2スーパーセットの開始
現在のコンダ環境がスーパーセットであることを確認します
gunicorn --workers 5 --timeout 120 --bind bigdata02:8787 "superset.app:create_app()" --daemon
説明:
- ワーカー:プロセスの数を指定します
- タイムアウト:ワーカープロセスのタイムアウト時間。タイムアウト後に自動的に再起動します
- bind:スーパーセットアクセスアドレスであるローカルアドレスをバインドします
- デーモン:バックグラウンドで実行
2.5.3 スーパーセットを停止する
gunicornプロセスを停止します
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
スーパーセット環境を終了します
conda deactivate
2.5.4 秒のuperset開始および停止スクリプト
vim superset.sh
#!/bin/bash
superset_status(){
result=`ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | wc -l`
if [[ $result -eq 0 ]]; then
return 0
else
return 1
fi
}
superset_start(){
# 该段内容取自~/.bashrc,所用是进行conda初始化
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/opt/module/miniconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
eval "$__conda_setup"
else
if [ -f "/opt/module/miniconda3/etc/profile.d/conda.sh" ]; then
. "/opt/module/miniconda3/etc/profile.d/conda.sh"
else
export PATH="/opt/module/miniconda3/bin:$PATH"
fi
fi
unset __conda_setup
# <<< conda initialize <<<
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
conda activate superset ; gunicorn --workers 5 --timeout 120 --bind bigdata02:8787 --daemon 'superset.app:create_app()'
else
echo "superset正在运行"
fi
}
superset_stop(){
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
echo "superset未在运行"
else
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
fi
}
case $1 in
start )
echo "启动Superset"
superset_start
;;
stop )
echo "停止Superset"
superset_stop
;;
restart )
echo "重启Superset"
superset_stop
superset_start
;;
status )
superset_status >/dev/null 2>&1
if [[ $? -eq 0 ]]; then
echo "superset未在运行"
else
echo "superset正在运行"
fi
esac
実行権限を追加します: chmod + x superset.sh
テスト: superset.sh start
2.5.5スーパーセットにログインする
訪問 のhttp:// bigdata0 2:8787および 以前に作成した管理者アカウントのパスワードを使用します
3.スーパーセットの使用
3.1MySQLデータソースのドッキング
3.1.1インストールの依存関係
conda install mysqlclient
注:さまざまなデータソースをさまざまな依存関係でインストールする必要があります。次のアドレスは、公式Webサイトの説明です。
http://superset.apache.org/installation.html#database-dependencies
3.1.2スーパーセットを再起動します
gunicornプロセスを停止します
ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9
起動
gunicorn -w 5 -t 120 -b bigdata02:8787 "superset.app:create_app()"
3.2データソースの構成
3.2.1 データベース構成
- [ソース/データベース]をクリックします
-
+をクリックします
-
クリックしてデータベースとSQLAlchemyURIを入力します
注:SQL Alchemy URI書き込み仕様:mysql:// account:password @ IP / database name
-
[接続のテスト]をクリックすると、「OK!」というプロンプトが表示され、接続が成功したことが示されます。
-
保存配置
3.2.2テーブル構成
- [ソース/テーブル]をクリックします
- +をクリックします
- テーブルの構成
3.3ダッシュボードを作成する
3.3.1空白のダッシュボードを作成する
- [ダッシュボード]をクリックします
- +をクリックします
- ダッシュボードを構成する
-
ダッシュボードを保存します
3.3.2チャートの作成
- チャートをクリックします
- +をクリックします
- データソースとグラフの種類を選択します
-
選択するチャートタイプ
-
チャートを作成する
-
便宜上、言語を中国語に変更できます
-
指示に従ってチャートを構成します
-
「クエリの実行」をクリックします
-
グラフを保存してダッシュボードに追加します