Kettle入门之一 介绍、安装

1、Kettle背景知识-ETL

抽取(Extract):一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。
转换(Transform): :任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:移动数据、根据规则验证数据、数据内容和数据结构的修改
加载(Load) :将数据加载到目标系统的所有操作。

2、Kettle介绍-基本使用

(1)Kettle 的几个子程序的功能和启动方式
Spoon.bat: 图形界面方式启动作业和转换设计器。
Pan.bat: 命令行方式执行转换。
Kitchen.bat: 命令行方式执行作业。
Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。
Encr.bat: 密码加密

(2)转换和作业
Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。
转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)。
作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,转换也是一个作业项。

(3)保存作业
用户通过 Spoon 创建的转换、作业、数据库连接等可以保存在资源库和 XML 文件中。
转换文件以 ktr 为扩展名,作业文件以 kjb 为扩展名
资源库可以是各种常见的数据库。可以在 Spoon 中自动创建资源库,资源库默认用户名和密码admin/admin。

3、Kettle 的安装

要运行此工具你必须安装Sun 公司的JAVA 运行环境1.4 或者更高版本,相关资源你可以到网络上搜索JDK 进行下载
绿色免安装,解压即可用。
在不同的平台上运行Spoon 所支持的脚本:
Spoon.bat: 在windows 平台运行Spoon。
Spoon.sh: 在Linux、Apple OSX、Solaris 平台运行Spoon。

我们可以进入 Kettle官网 进行下载,进入之后,下拉页面,看到如图所示;
https://sourceforge.net/projects/pentaho/files/Data%20Integration/
在这里插入图片描述
此处选择7.1版本
在这里插入图片描述

2、Kettle 环境配置
由于Kettle是使用Java语言编写的,所有Kettel的运行需要有Java环境,安装JDK,Windows环境下JDK安装和配置,参考链接:https://baijiahao.baidu.com/s?id=1630229511923551996&wfr=spider&for=pc

3、运行Kettle
进入到Kettle目录,如果Kettle部署在windows环境双击Spoon.bat文件启动Kettle,如果是在Linux环境下,则运行spoon.sh文件启动。出现如下界面,则我们的Kettle就安装成功了。
在这里插入图片描述
在这里插入图片描述

发布了91 篇原创文章 · 获赞 2 · 访问量 7055

猜你喜欢

转载自blog.csdn.net/qq_43211632/article/details/104661868