亚马逊云科技AI创新应用下的托管在AWS上的数据可视化工具—— Amazon QuickSight

目录

Amazon QuickSight简介

Amazon QuickSight的独特之处

Amazon QuickSight注册

Amazon QuickSight使用

Redshift和Amazon QuickSightt平台构建数据可视化应用程序

构建数据仓库

数据可视化


Amazon QuickSight简介

亚马逊QuickSight是一项可用于交付的云级商业智能 (BI) 服务easy-to-understand向与您共事的人提供见解,无论他们身在何处。亚马逊QuickSight连接到您的云端数据,并合并来自许多不同来源的数据。在单个数据仪表板中,QuickSight可以包括 AWS 数据、第三方数据、大数据、电子表格数据、SaaS 数据、B2B 数据等。作为一项完全托管的基于云的服务,亚马逊QuickSight提供企业级安全性、全球可用性和内置冗余。它还提供了从 10 个用户扩展到 10,000 个用户所需的用户管理工具,所有这些工具都无需部署或管理基础架构。

QuickSight让决策者有机会在交互式视觉环境中探索和解释信息。他们可以从您网络上的任何设备和移动设备安全访问仪表板。

Amazon QuickSight的独特之处

以下是使用亚马逊的一些好处QuickSight用于分析、数据可视化和报告:

  • 内存引擎,称为SPICE,以惊人的速度响应。

  • 没有许可证的前期成本,总拥有成本 (TCO) 也很低。

  • 无需安装应用程序即可进行协作分析。

  • 将各种数据合并为一项分析。

  • 以仪表板的形式发布和共享您的分析。

  • 控制功能在仪表板中可用。

  • 无需管理精细的数据库权限,仪表板查看者只能看到您共享的内容。

对于高级用户,QuickSight企业版提供更多功能:

  • 借助由机器学习 (ML) 提供支持的自动化和可自定义的数据见解,为您节省时间和金钱。这使您的组织无需任何机器学习知识即可完成以下操作:

    • 自动做出可靠的预测。

    • 自动识别异常值。

    • 找出隐藏的趋势。

    • 根据关键业务驱动因素采取行动。

    • 将数据转换为easy-to-read叙述,例如仪表板的标题图块。

  • 提供额外的企业安全功能,包括:

    • 使用联合用户、群组和单点登录(IAM 身份中心)AWS Identity and Access Management(IAM) 联邦、SAML、OpenID Connect 或AWS Directory Service for Microsoft Active Directory。

    • AWS 数据访问的精细权限。

    • 行级安全。

    • 高度安全的静态数据加密。

    • 访问 Amazon 虚拟私有云中的 AWS 数据和本地数据

  • 优惠pay-per-session为您置于 “读者” 安全角色的用户定价—读者们是仪表板订阅者,即查看报告但不创建报告的人。

  • 赋予你创作能力QuickSight通过部署嵌入式控制台分析和仪表板会话,成为您自己的网站和应用程序的一部分。

  • 为分析服务的增值经销商 (VAR) 提供多租户功能,使我们的业务成为您的业务。

  • 使您能够以编程方式编写可转移到其他 AWS 账户的控制面板模板脚本。

  • 使用分析资产的共享和个人文件夹,简化访问管理和组织。

  • 为以下对象启用更大的数据导入配额SPICE数据摄取和更频繁的数据刷新。

Amazon QuickSight注册

  • 为了使用QuickSight,需要拥有一个有效的AWS账户。 如果没有AWS账户,访问http://console.aws.amazon.com/并首先创建一个账户。 登录到AWS控制台后,搜索QuickSight并单击链接,如下所示:

  • 将被导航到Amazon QuickSightt的门户,将特别要求在其中注册该服务。 单击“ 注册QuickSight”,然后继续进行。 在下一页上,可以选择版本。 我这里选择标准版 ,然后单击继续

  • 在下一页上,将需要提供QuickSight服务的帐户名和一个可以接收通知的电子邮件地址完成后,单击完成。

  • 该过程可能需要花费几分钟,一旦完成,将收到一条消息,提示成功注册Amazon QuickSightt。

Amazon QuickSight使用

  • 单击转到Amazon QuickSightt以启动服务。 将被导航到其他服务,在其中可以看到QuickSight正在加载一些已经准备好的示例分析。

  • 只是为了对样本分析有所了解,让我们继续打开列表中可用的Sales Pipeline分析 。 所见,将启动一个新的分析,将能够按照以下方式查看报告。

Redshift和Amazon QuickSightt平台构建数据可视化应用程序

  • 创建Redshift集群

  • 将S3的数据文件批量装载到Redshift数据库

  • 使用Quicksight对数据表进行可视化

本程序的架构图如下图所示:

构建数据仓库

  • 查看数据

  • 创建 IAM Role

选择 IAM 服务,点击角色->创建角色,选择 Redshift

选择 Redshift-Customizable,点击下一步权限

添加权限名字 myRedshiftRole,点击确认

  • 创建子网组

创建 Redshift 集群前,先创建子网组。选择 Redshift 服务,在左边菜单条中选择“CONFIG”->”管理子网组“

然后选择“创建集群子网组”,子网组名称可接受缺省名字“cluster-subnet-group-1“,在描述框中输入任意说明文字。选择“默认VPC”,选择“为此 VPC 添加所有子网“,然后点击“创建集群子网组”完成创建子网组。

  • 创建 Redshift 集群

在左侧菜单中选择“集群”,点击“创建集群“,设置集群的名字(不要用中文,不要用特殊字符,英文开头,可以有数字,可以有减号),节点类型选择 dc2.large

数据库配置接受缺省值,输入主用户密码(请记住您输入的密码)

集群权限中,选择前面创建的 myRedshiftRole 角色,点击“Associate IAM role”

其它配置中,选择默认 VPC,缺省安全组和之前创建的集群子网组,点击确认“创建集群”,大约5分钟后,集群变为“Available”状态。

  • 访问 Redshift 数据库

有两种方式访问 Redshift 数据库,一种是通过 Redshift Console 上的查询编辑器,一种是通过 SQL 客户端(例如 SQL Workbench/J 客户端)。本实验中为了简便操作,使用 Redshift Console 上的查询编辑器来访问数据库。选择左边菜单中“编辑器”,在“连接到数据库”窗口中输入一下参数,然后“连接到数据库”

  • 创建表

在查询编辑器中创建表,在左边Select Schema中选择“Public”,然后在SQL查询窗口中输入创建表的SQL语句:

create table table1(
    tno varchar(20),
    tdate varchar(15),
    uno varchar(10),
    pno varchar(10),
    tnum int,
    uname varchar(20),
    umobile varchar(20),
    ano varchar(20),
    acity varchar(50),
    aname varchar(50),
    pclass varchar(10),
    pname varchar(50),
    price decimal(10, 2)
);

  • 导入S3数据

新开一个 SQL 查询窗口(此处为 Query 2),输入下面装载 S3 数据的 SQL 命令,注意要将帐号替换为实际的帐号 ID,并确认争取的 S3 桶地址。

copy table1 from 's3://lab-921283538843-wzlinux-com/spark/output/' 
credentials 'aws_iam_role=arn:aws:iam::921283538843:role/myRedshiftRole' 
format as parquet;

点击运行,结果应显示为“Completed”。在 Query3中 输入”select from table1;”应查询中表中的数据。在Query4 中输入“select count() from table1; “,应查询到表中的数据。这说明 S3 中的数据已完成 copy 到 Redshift 数据仓库中。

  • 允许 Internet 访问

下一步,我们将使用 AWS Quicksight 将 Redshift 中的数据进行可视化展现。在此之前,需要给予 Quicksight 从 Internet 访问 Redshift 的权限。为此,我们先在 EC2 菜单中创建一个公网的弹性 IP 地址(过程略)。然后修改 Redshift 属性,赋予公开访问权限。

将可公开访问改成“是”,选择对应的弹性公网 IP 地址即可。

数据可视化

  • 启用 Quicksight

  • 创建数据集

进入Quicksight控制台界面,点击左侧数据集,选择创建“新数据集”

选择 Redshift(自动发现)数据集,Redshift 也有手动连接的方式.

输入连接参数,选择“创建 data source”,选择对应的 Redshift 数据库,注意配置对应的地址,端口,数据库名称,用户名和密码

选择 Table1,点击“Select”,最后点击“Virtualize”完成创建数据集(此处我们选择把数据从 Redshift 导入到 Quicksigh 里面来,这样分析起来速度会快很多)

  • 数据可视化

打开可视化对象窗口,选择展现方式为“竖条状图“

tdate 拖放到 X axis 栏,将 tnum 拖动到 value 栏(系统会自动选择计数)

猜你喜欢

转载自blog.csdn.net/lbcyllqj/article/details/134477741
今日推荐