Severless SQL on OSS 实验（DataLakeAnalytics on OSS）

数据库 2018-06-20 16:34:10 阅读次数: 7

摘要：数据存储在OSS后，可以有多种方式查询分析OSS数据，如自建Spark/Presto/Impala（阿里云EMR以及Hadoop社区官方已支持OSS）, 使用MaxCompute、DataLakeAnalytics等。

基于OSS的数据查询分析

数据存储在OSS后，有多种查询分析的方法，包括阿里云MaxCompute、DataLakeAnalytics产品等Severless查询分析服务，也可以自建Spark、Presto、Imapla应用来分析OSS上的数据。

实验步骤（DataLakeAnalytics on OSS）

本次实验，主要介绍实验DataLakeAnalytics如何Severless地查询分析OSS上的数据。

服务开通

OSS服务：

1.开通OSS服务https://www.aliyun.com/product/oss

DataLakeAnalytics服务：

1.申请DataLakeAnalytics的试用资格
备注：目前DataLakeAnalytics公测中，需提交公测申请，开通试用。

操作步骤

扫描二维码关注公众号，回复： 1661744 查看本文章

准备数据

登录控制台，并创建目录

请创建华东1区域的OSS测试Bucket（目前DataLakeAnalytics产品公测区域为华东1）。

备注：Bucket名称是全局唯一，如果提示名称已存在，请更换一个Bucket名称。

创建目录（建议目录如下）：

创建目录workshop_sh/trade, workshop_sh/user

下载模拟数据（该数据本次实验的模拟数据）

http://testdatasample.oss-cn-hangzhou.aliyuncs.com/workshop_sh/workshop_sh.zip

将下载的将交易记录和开户信息数据，分别上传到trade、user目录

登录Data Lake Analytics控制台

点击“登录数据库”，输入开通服务时分配的用户名和密码，登录Data Lake Analytics控制台。

公测期间的分配的用户名、密码，开通服务的消息中可以查看

创建Schema和Table

创建Schema

输入创建SCHEMA的语句，点击“同步执行”。

CREATE SCHEMA sh_trade

CREATE SCHEMA sh_trade
（注意：同一个阿里云region，schema名全局唯一，建议根据业务定义，已有重名schema，在创建时会提示报错，则请换一个schema名字。）

创建表

在“数据库”的下拉框中，选择刚刚创建的schema。
然后在SQL文本框中输入建表语句如下，并点击同步执行。其中，Location替换为您的Bucket和测试数据的路径

1.创建交易记录表：
说明：LOCATION 'oss://Bucket名称/交易记录表目录/'
实验中，替换LOCATION 'oss://您的OSS存储空间名称/workshop_sh/user/'。如：oss://workshopsh20180608100/workshop_sh/user

2.创建开户信息表：
说明：LOCATION 'oss://Bucket名称/开户信息表目录/'
实验中，替换LOCATION 'oss://您的OSS存储空间名称/workshop_sh/user/'。如：oss://workshopsh20180608100/workshop_sh/user

3.建表完毕后，刷新页面，在左边导航条中能看到schema下的2张表

SQL查询(同步执行)

1.查询交易机构SXS_0010，在0603至0604的100条交易记录

显示执行结果

2.查询各城市、男性女性人群，购买的基金总额（多表Join查询）

SQL查询(异步执行)

异步执行查询，将查询结果，以CSV格式，输出到OSS上

点击“执行状态”，可看到该异步查询任务的执行状态

主要分为：“RUNNING”，“SUCCESS”，“FAILURE”。

点击“刷新”，当STATUS变为“SUCCESS”时，可以查看到查询结果输出到OSS的文件路径。

查看导出OSS的结果文件

实验耗费

OSS存储的费用

猜你喜欢

转载自blog.51cto.com/13679539/2130993

Severless SQL on OSS 实验（DataLakeAnalytics on OSS）

oss

OSS重磅推出OSS Select——使用SQL选取文件的内容

OSS初识

OSS上传

oss ---listimage

阿里oss

OSS RFC

oss 上传

oss配置

OSS（一）:OSS工具类

基于OSS+DataLakeAnalytics+QuickBI的Serverless的查询分析和可视化BI

OSS重磅推出OSS Select——使用SQL选取文件的内容【免费公测中】

OSS- OSS brower 登陆失败

OSS-Fuzz----OSS-Fuzz简介

Oss文件存储

阿里oss文件上传

SpringBoot上传到OSS

erlang aliyun upload Oss

OSS文件上传

Yaf引入oss sdk

【OSS】单点登录

BSS OSS MSS

OSS云存储方法

前端oss上传文件

OSS-图片上传

OSS是什么玩意？

ThinkPHP 3使用OSS

OSS分段上传

thinkphp 5 使用oss

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)