スーパーセット公式入門チュートリアル中国語の翻訳

スーパーセットの公式文書からこの翻訳:Toturial -あなたの最初のダッシュボードを作成します

ドキュメントの最新バージョンでのスーパーセットインタフェースと機能は、実際のメインにはほとんど相違があった言及しました。のみ翻訳のためのこの記事

はじめに - あなたの最初のかんばんを作成します

このチュートリアルでは、ターゲットユーザーは、スーパーセットでチャートやかんばんを作成したい人々です。私たちは、新しいデータベースにスーパーセットを介して接続し、分析のために図書館にテーブルを設定する方法を紹介します。また、あなたはかんばんを視覚化するグラフを追加することができ、データベースに追加されたデータを探索するために行くことができます。このチュートリアルでは、(エンドツーエンド)ユーザエクスペリエンスをエンドツーエンドを持つことができます。

新しいデータベースへの接続

すでに優れたデータベースの構成であり、実行中のスーパーセット環境を経由して接続することができると仮定。あなただけのSupertestを経験し、いくつかのサンプルデータを探索したい場合は、読み込むことができます設定PostgreSQLのサンプルデータを新しいデータベースにするか、このセクションで私たちを構成するために使用される気象サンプルデータ

ではデータソースメニュー、選択したデータベースオプション:

ソース・データベース

緑色の「+」記号の右上隅を選択し、結果ページに移動:

アドオンデータベースボタン

このページでは、高度なオプションの数を設定することができますが、このチュートリアルでは、あなただけうまく次の二つを設定する必要があります。

  1. 名前に来るようにデータベースを追加するには:

名前データベース

  1. SQLAlchemyのURI入力接続し、接続をテストします。

SQLAlchemyの-postgresqlの-URI

図は、テストのための気象データベースの接続を示しています。以下に示すようにURIのテキストは、あなたはSQLAlchemyのマニュアルを参照してくださいすることができ、新しい接続URIを作成するターゲット・データベースに接続します。

点击 测试连接 按钮来确认两端都没问题。如果 Superset 能够成功连接并获得授权,那么你将看到如下弹窗提醒:

database-connection-success

此外,你应该能够在页面底部看到 Superset 能够读取到的、你刚添加的数据库中已经创建的表:

table-list

如果连接没问题,点击位于页面底部的 保存 按钮来保存这个配置:

save-database-configuration

添加新表

到此数据库已经配置好了,你需要添加一个将要用于查询的具体的表到 Superset 中。

数据源 按钮下,选择 数据表 选项:

source-tables

在跳转的结果页中,单击右上角的绿色“+”号按钮:

add-new-table

为了添加新表到 Superset 中你只需要添加少许的几个信息即可:

  • 表名

name-table

  • 数据库 下拉列表中选择目标库(例如,你刚才添加上去的一个)

choose-database

  • 可选的,数据库的 schema。如果数据表是存在于默认的 schema 中(例如 PostgreSQL 或者 Redshift 中的 public),那么该选项可以留空。

单击 保存 按钮来保存配置:

save-table-configuration

当页面重定向到数据表清单页面后,你应该能看到一条信息提示说你的表已经创建好了:

cretaed-info

这条信息同时也告诉你可以编辑表配置。我们当前将仅会编辑一小部分配置-为了能让你开始-同时剩下一些留在高级教程中。

在你刚才创建的表旁边单击编辑按钮:

edit-table-configuration

在结果页中,点击 列列表 标签。在这里,你可以定义一些在探索数据时使用到的具体列。我们将会历遍这些选项去描述它们的作用:

  • 如果你希望用户根据具体的列来进行分组,那么在 可分组 下勾选它
  • 如果你需要根据具体的列来进行过滤,那么在 可过滤 下勾选它
  • 是否有一些字段你需要去统计它的唯一值个数的?勾选 唯一性统计
  • 是否有一些字段你需要去求和的,或者想要得到一些基本的统计信息?那么 求和最小值最大值 列会有帮助
  • 所有的日期或者时间字段,都应该勾选上 表示时间(原文是 is temporal )。我们将会在稍后讲述它们是如何操作的。

(译注:目前我安装上的版本中,只剩下可分组、可过滤、表示时间这三个选项了)

以下是已经针对天气数据配置好的字段。对于天气数据的测量(比如降雨量、降雪量等等)来说,根据以下这些字段它已经足够去分组和过滤的了:

weather-data-configuration

如上图所示,点击 保存 按钮以保存这些配置。

探索数据

要探索数据,只需要在表列表中点击你刚才创建的表的名字即可:

weather-data-denormalized

默认地,展现在你面前的是表视图(Table View):

table-view

让我们使用一些基本的查询来统计表中的所有记录数。首先,我们需要更改 时间(Since)过滤器来取得数据的时间范围,你可以通过一些简单的词语来应用这个筛选,例如“3年前”:

since

而这个时间区间的上限,在 Until 过滤器中,默认是 现在,当然这个可能并不是你想要的。

再看到位于 分组 下方的 指标 部分,可以在其中输入 “Count” —— 你会看到一个根据你的输入而匹配出来的指标列表:

metrics

选择 COUNT(*) 指标,然后点击位于探索器顶部旁边的绿色按钮:

query-button

你将会右侧的表格里看到查询结果:

query-result

让我们在 分组 区域中,以 weather_description 字段为分组,取得以天气记录类型为分类的记录数有多少:

group-by-weather-description

执行查询:

query-result

让我们查找一个更加有用的数据:在 2015 年有记录的温度最高的时间和地点的 TOP 10。

分组 区域中,把 weather_description 替换为 latitudelongitudemeasurement_date

group-by-latitude-longitude-measurement_date

同时在 指标 区域中,把 COUNT(*) 替换为 *max__measurement_flag*:

metrics-max__measurement_flag

*max__measurement_flag* 指标是在我们前面配置表的时候,勾选了 measurement_flag 字段对应的 Max 选框而创建的,指明这个字段是一个数值并且当需要根据指定的字段进行分组的时候我们要在其中查询它的最大值。

在本案例中,measurement_flag 是测量所需要使用到的值,它很明显是依赖于测量的类别的(研究者会记录不同的降雨量和气温的值)。因此,我们必须仅在 weather_description 相等于 “Maximum temperature” 的记录中过滤我们的查询,这个过滤会在探索器窗口底部的 过滤 模块中进行:

filters

最后,由于我们仅关心 top 10,所以我们要限制我们的查询结果为 10 条记录,通过位于 Options 头下方的 行限制 来实现:

row-limit

点击 查询 然后可以得到如下的结果:

query-result

在这个数据集中,最高温度以十分之一摄氏度记录( is recorded in tenths of a degree Celsius)。最大值是 1370,在内华达州中部测量得到的,相当于 137 摄氏度,或约等于 278 华氏度。这个数据可能是错的。我们已经使用 Superset 探查了一些异常值,但这仅仅是冰山一角。

你可以通过这些方法来做许多事情:

  • 默认的显示数值的格式是 1.37k,是不便于人们阅读的。可能你会更加喜欢使用全的、使用逗号分隔的值。通过修改配置(编辑 表配置 > 列出 SQL 指标 > 编辑指标 > D3 格式)你可以更改任何一个指标数据的格式。
  • 此外,可能你想把温度直接以原生的摄氏度来显示,而不是显示它的 10 倍值,又或者你需要把它转换成华氏度来显示。你可以修改针对数据库执行的 SQL 语句,将转换逻辑直接映射到指标本身(编辑 表配置 > 列出 SQL 指标 > 编辑指标 > SQL 表达式)。

それでは、チャートのためにこれらのデータのより良い可視化を作成し、かんばんにそれを追加してみましょう。

私たちは、「配布 - ヒストグラム」へのチャートの種類を変更します。

分布-柱状图

私たちの前に設定された最大温度指標のフィルタを保持することができますが、クエリおよび書式設定オプションは、チャートの種類に依存しているので、あなたは再び、これらの値を設定する必要があります。

chart-options

ように設定して軸ラベル、マージン、スケールと:あなたはこのチャートのために、それはより多くの書式設定オプションを持っていることに注意すべきです。より多くの人のチャートの前で実証するためには、これらのチャートの多くを使用し、かんばんにそれらを追加したい場合があります。今、私たちは、クエリを実行し、次のチャートを取得します:

temperature-bar-chart

スライスとかんばんを作成します

これらの数字は、ある研究者のために有用である、だから、それを保存できます。スーパーセットでは、保存されたクエリの一つが呼び出されたスライス(スライス)。

スライスを作成するには、エクスプローラの左上隅にある[保存]ボタンをクリックします。

save-chart

この時点で、ポップでスライス名を書くことが表示され、あなたがかんばんオプションに追加するかどうかがあるでしょう。我々は同時に我々の看板のこのスライスに直接添加を作成することができ、タスクかんばんを作成していないので。

save-a-chart

[保存]をクリックし、あなたが戻って元のクエリインターフェイスにリダイレクトされます。同時に、私たちは、スライスと看板が正常に作成されている見ることができます:

created-success

私たちの新しい看板を確認します。クリックかんばんメニューを:

dashboard

かんばんはただ作成が見つかりました:

weather-data-dashboard

すべてが順調である - 我々スライスはここにあります:

weather-data-slice

しかし、我々がそれを予想より小さくなっています。幸いなことに、あなたはカード内のスライスを調整することができます。行くとあなたが希望のサイズになるまで右下隅をドラッグすることはできません、マウスダウンを保ち、それをクリックしてください:

adjust-size-of-slice

調整が終わった後、あなたは、この新しい設定を保存するためにカンバン左上のボタンをクリックするように求められます。

おめでとうございます!あなたは、成功したスーパーセットを接続されている分析し、データの可視化。そしてそう模索し、それと看板の独自のスライスの作成を開始してください、多くのテーブル構成と可視化のオプションがあります。

この翻訳は私に属しているブログパーク-東ワイが横たわっていたすべて、ソースを明記してください

おすすめ

転載: www.cnblogs.com/wuzhiblog/p/superset-chinese-toturial.html