Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。kettle的数据抽取主要在于抽取数据,而没有考虑数据库的函数、存储过程、视图、表结构以及索引、约束等等,如果想对这些内容进行迁移,就需要通过写脚本或者更改kettle源码的方式实现了。
以下是Kettle的国内镜像下载地址: http://mirror.bit.edu.cn/pentaho/Data%20Integration/ 解压后进入到Kettle目录,双击运行spoon.bat文件,出现如下界面及说明kettle成功部署。 在运行之前,我们需要把对应数据库的jar包导入到Kettle的lib目录下,比如我们需要把oracle迁移到mysql,那就需要oracle和mysql两个jar包: 这个jar包可以直接复制项目里面的,就不用纠结版本问题了。
1.新建作业 选择界面上的文件–新建–作业 2.新建数据库连接 由于需要将oracle迁移到mysql,所以我们要分别配置oracle和mysql两个数据库。 配置oracle数据库: 配置mysql数据库: 这里有个坑需要注意一下,就是oracle数据库本身的编码要和mysql的保持一致,同时我们需要在配置mysql连接的“选项”里面配置对应的编码,否则mysql里面导过去的表会出现乱码,且某些表可能会迁移失败造成job异常终止: 3.进行多表迁移 配置完成后,选择“工具=>向导=>复制多表向导” 在弹出框中选择源数据库和目标数据库: 点击“下一步”,在左侧选择需要导入到mysql的库表: 点击“下一步”,输入名字和存储位置: 点击“完成”,会自动生成转换过程:
此时,点击左上角的运行按钮直接执行: 运行结束后,查看执行结果的日志和作业度量是否有报错,没有报错代表迁移成功: 最后需要查看一下mysql数据库库表的数据是否一致,可以使用count语句判断,此外,如果数据库有大量?之类的字符,就要考虑数据库编码选择是否一致且mysql的编码配置是否正确了。