目录
一、安装
kettle依赖jvm,java7应选择kettle6版本(如:pdi-ce-6.0.1.0-386.zip),java8及以上选择kettle7以上版本(如:pdi-ce-7.0.0.0-25.zip)。
如遇此情况,则为版本不匹配,需根据当前jdk版本适当升降kettle版本,jdk最低版本1.5。
下载后直接解压,双击Spoon.bat文件即可打开。
Spoon.bat: 图形界面方式启动作业和转换设计器。
Pan.bat: 命令行方式执行转换。
Kitchen.bat: 命令行方式执行作业。
Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。
Encr.bat: 密码加密
转换和作业:
Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。
•转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)。
•作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,转换也是一个作业项。
二、连接数据库
连接前需要将相应的数据库驱动包放入**\data-integration\lib目录下。
Oracle,取D:\db\oracle\app\product\11.2.0\dbhome_1\jdbc\lib包下的ojdbc5.jar和ojdbc6.jar,如lib目录下原来有ojdbc的jar包,则需删除,配置完需重启方可生效。
连接oracle数据库,主机名称前需要加双斜杠“//”,数据库名称前需要加单斜杠“/”。
sqlserver驱动包同理,去相应目录下找,然后放到**\data-integration\lib目录下。
连接sqlserver数据库,直接输入即可。
mysql,取相应jar包(如:mysql-connector-java-5.1.6-bin.jar)放到**\data-integration\lib目录下。
连接mysql数据库,直接输入即可。
三、创建资源库
选择工具=》资源库=》连接资源库=》
点击右上角加号=》
选择第一项数据库类型资源库Kettledatabase repository,点击“确定”=》
选择数据库连接,如果有则选择,没有则点击新建,重复上面创建数据库连接的方式,创建完填写名称描述。=》
点击创建或更新,会生成SQL脚本,点击执行即可。
oracle资源库共46张表。
至此,kettle的安装和创建资源库,连接数据库完成。
java调用kettle API:https://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+-+Java+API+Examples
kettle多表关联更新:https://www.jianshu.com/p/eb6c0d55bb2c
后续待更新。。。