Kettle使用过程

目录

一、安装

二、连接数据库

三、创建资源库


一、安装

kettle依赖jvm,java7应选择kettle6版本(如:pdi-ce-6.0.1.0-386.zip),java8及以上选择kettle7以上版本(如:pdi-ce-7.0.0.0-25.zip)。

如遇此情况,则为版本不匹配,需根据当前jdk版本适当升降kettle版本,jdk最低版本1.5。

下载后直接解压,双击Spoon.bat文件即可打开。

Spoon.bat: 图形界面方式启动作业和转换设计器。
Pan.bat: 命令行方式执行转换。
Kitchen.bat: 命令行方式执行作业。
Carte.bat: 启动web服务,用于 Kettle 的远程运行或集群运行。
Encr.bat: 密码加密

转换和作业:

Kettle 的 Spoon 设计器用来设计转换(Transformation)和 作业(Job)。

  •转换主要是针对数据的各种处理,一个转换里可以包含多个步骤(Step)

  •作业是比转换更高一级的处理流程,一个作业里包括多个作业项(Job Entry),一个作业项代表了一项工作,转换也是一个作业项。

二、连接数据库

连接前需要将相应的数据库驱动包放入**\data-integration\lib目录下。

Oracle,取D:\db\oracle\app\product\11.2.0\dbhome_1\jdbc\lib包下的ojdbc5.jarojdbc6.jar如lib目录下原来有ojdbc的jar包,则需删除,配置完需重启方可生效。

连接oracle数据库,主机名称前需要加双斜杠“//”,数据库名称前需要加单斜杠“/”。

sqlserver驱动包同理,去相应目录下找,然后放到**\data-integration\lib目录下。

连接sqlserver数据库,直接输入即可。

mysql,取相应jar包(如:mysql-connector-java-5.1.6-bin.jar)放到**\data-integration\lib目录下。

连接mysql数据库,直接输入即可。

三、创建资源库

选择工具=》资源库=》连接资源库=》

点击右上角加号=》

选择第一项数据库类型资源库Kettledatabase repository,点击“确定”=》

选择数据库连接,如果有则选择,没有则点击新建,重复上面创建数据库连接的方式,创建完填写名称描述。=》

点击创建或更新,会生成SQL脚本,点击执行即可。

oracle资源库共46张表。

至此,kettle的安装和创建资源库,连接数据库完成。

java调用kettle API:https://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+-+Java+API+Examples

kettle多表关联更新:https://www.jianshu.com/p/eb6c0d55bb2c

后续待更新。。。

发布了57 篇原创文章 · 获赞 10 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/zh_1721342390/article/details/102482610