Kettle环境搭建及使用(数据迁移)

Kettle的功能非常强大,是一款免费开源的ETL工具。这里主要讲将Excel文件数据导入到数据库中。

Kettle下载
下载地址:https://community.hitachivantara.com/docs/DOC-1009855

进入以上网址,一直下滑到Download

目前最新版本是7.1,直接点击就能下载,老版本需要选择,我下载的是7.1版本。

安装
Kettle的安装非常简单,但是Kettle使用java编写的,所以要预先安装好JDK环境。

JDK下载地址:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

JDK安装好之后,Kettle下载完直接解压,找到spoon.bat文件双击,等待启动即可。

Kettle启动界面:

  • Kettle的使用

界面是中文的,用起来非常方便

左边主对象树有转换后作业两个选项,我们数据迁移,用到的是转换,双击转换进入核心对象。

浏览选择需要导入数据库的excel文件,选完左边的文件或目录能看到名字,如果是多个文件在一个文件夹下,也可以选择目录,正则表达式输入正则匹配。单击增加将文件增加到选中的文件,是否成功可以用显示文件名称查看。完了切换到工作表:

工作表按以上步骤操作,这里得到的工作表是你excel文件中创建的所有的工作表。起始行和起始列数字都是从0开始,起始行是表头也算上。比如说你的表是第一行是表头,第二行是数据,从A列开始,那么起始行和起始列都是0;如果你的表头在第4行,第5行是数据,从C列开始,那么起始行是3,起始列是2。换到字段:

有表头的直接点击获取来自头部数据的字段,确认。输入就全部操作完了。

输出展开>>>表输出拖到右边>>>双击表输出图标

填写数据库连接名称(可随意填写)>>>选择数据要导入自己所需类型数据库>>>选择数据库访问类型>>>Next

填写服务器主机名>>>TCP/IP端口>>>数据库名称>>>Next

填写用户名和密码>>>测试数据连接>>>Finsh

注意:这里可能报错,连接不成功,这是缺少lib,下载相应的连接lib放到Kettle解压目录下的lib下即可

数据库连接成功之后目标表浏览选择一张数据将导入的表,数据库字段要与excel的字段对应起来,表字段为数据库表的字段,流字段为excel的字段。完成之后确认。

按住shift将excel输入和表输出连接起来,点击小三角形,弹出执行转换框点启动,再弹出一个框点确认

转载自:https://blog.csdn.net/qq_38314823?t=1

猜你喜欢

转载自blog.csdn.net/wyz0516071128/article/details/88586085