Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。,Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,转换和作业,转换完成针对数据的基础转换,作业则完成整个工作流的控制。作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。
由于很多开源项目到最后都成了无人管的项目,为了避免这种情况的发生,要尽快为Kettle项目构建一个社区。这就意味着,在随后的几年可能需要回答上千封的电子邮件和论坛帖子。幸运的是,Kettle很快获得了开源商业智能公司Pentaho的帮助(www.pentabo.com),Pentaho获得了源代码的版权,Matt也成为了Pentaho的内部人员,带领kettle项目的开发,随后Kettle改名为Pentaho Data Integration。
下载和安装
1、Kettle是纯JAVA编程的开源软件,需安装jdk,版本在1.7以上,jdk下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
2、Kettle是款绿色软件,无需安装,下载解压后可以直接使用,Kettle下载地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/
配置环境变量
新建两个系统变量JAVA_HOME和KETTLE_HOME,并把JAVA_HOME和KETTLE_HOME添加到Path里。
JAVA_HOME:jdk安装路径
KETTLE_HOME:kettle解压路径
启动kettle
在kettle解压包目录下运行Spoon.bat即可启动kettle,首次启动时间会有点长。