Edata敏捷挖掘工具操作指引

Edata敏捷挖掘工具操作指引

一、登入系统

谷歌浏览器输入网址http://10.150.88.64:16060/Edata进入Edata登陆页面。

输入用户名密码,点击“登陆”,进入首页。

点击【数据管理】,进入敏捷挖掘模块。

 

二、配置数据源

  1. 新建数据源

【数据管理】>>【新建关系数据源】

说明:在左侧数据源目录(位置:【数据源】>>【知识竞赛】)上右键新建关系数据源;

不要使用点击图标的方式,因为图标是默认在根目录建立数据源,会提示没有权限。

2.编辑数据源

1,选择驱动类型为MySQL,系统自动配置如下:

2,编辑连接字符串:

需要将<servername>修改为IP:端口,<database>修改为相应数据库名;

3,填入用户名,密码;

4,点击【测试连接】,提示“测试通过”,表示配置成功,点击【保存】。

说明

数据源节点的配置可以参考截图,竞赛人员只需修改数据库名,用户名,密码。

3. 数据源管理

在刚建好的数据源上右键【数据库管理】,界面如下。

将【可用数据库资源】下的表移到【已选数据库资源】,点击【保存】。

三、创建数据集

【大数据工具】>>【新建原生SQL查询】,在弹出的数据源选择窗口中选择数据源(位置:【数据源】>>【知识竞赛】>>【知识竞赛源数据库】),进入SQL编辑界面如下:

在SQL文本区输入相应SQL语句,点击工具栏的图标,弹出输出数据界面如下:

点击左上角按钮即可输出数据。

关闭弹窗,点击工具栏图标进行保存。

 

 

 

点击【大数据工具】>>【敏捷挖掘】,进入敏捷挖掘模块。

四、 新建工作流

点击【文件】>>【新建工作流】,在弹窗中填入“工作流名”,选择“工作流存放位置”

 

五、配置数据源

点击【节点库】>>【数据源】,左键单击【SmartDI】节点不放,拖到工作流区域,双击节点,进行配置,如下图所示。

竞赛按目录【数据源】>>【知识竞赛】>>【知识竞赛源数据库】选择库表。

说明

每个节点有三种状态:

表示节点配置有误,此时工作流无法正常执行;

表示节点配置正常,可以执行工作流;

表示节点已有缓存,可以通过在节点上右键查看数据;

可视化节点存在缓存时,无法执行,若需要重新执行,可通过修改改节点之前的节点,或者在该节点上右键“清除缓存”

双击节点或在节点上右键选择【配置】。

选择相应表,点击【确定】,看到节点的状态变为,表示节点数据源配置完成。

也可以点击【仪表盘】,选择第三步创建的sql查询,拖拽至编辑区,点击右键预览按钮,预览数据,将sql的分析结果,作为工作流的输入,进一步做分析。

六、数据分析

七、结果数据导出

打开【节点库】>>【数据导出】目录,拖一个【数据库】节点到工作区,将要导出的数据对应的节点连接到该节点。配置数据库连接信息。配置同数据源。

配置说明:

如果表已存在

覆盖:删除原表,重新建表,插入数据

追加:直接插入数据

禁止:不允许导数据

配置完成后点击【应用】,如果消息栏没有错误提示表示配置正确,点击【确定】,该节点的状态变为。此时就可以执行工作流导出分析结果到对应的数据库了。

八、导出为CSV格式文件

  1. 创建数据集

方式一

该方式操作简单,但最多只能导出20000条数据。

工作流最后一个节点连接一个【表】节点,在【表】节点右键选择【执行并打开视图】

工作流将自动弹出结果数据列表窗口

点击右下角【发布】

操作步骤

  • 位置选择“我的空间”;
  • 输入名称;
  • 是否发布任务不进行勾选
  • 点击【确定】
  • 回到首页>>大数据工具>>我的空间,可以看到刚刚发布的原生SQL查询“数据集1”

方式二

该方式操作较为复杂,但可以导出全量数据。

配置数据源

二、配置数据源

创建数据集

三、创建数据集

2. 导出CSV

打开创建好的数据集,点击工具栏的图标,弹出输出数据界面,点击“导出”>>“CSV”,如下

 

在弹出的窗口中,导出查询结果选择“全部”

点击【确定】,即可将分析结果数据导出为CSV格式文件。

 

 

猜你喜欢

转载自blog.csdn.net/juiceda/article/details/82563044