热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

kettle中的switch_Kettle学习笔记(二)—基本操作

目录打开Kettle打开时间略长,请耐心等待。常用的控件说明这里先对控件做下简单说明,方便后面使用。通用控件通用——START:作业开始&

目录

打开Kettle

打开时间略长,请耐心等待。

常用的控件说明

这里先对控件做下简单说明,方便后面使用。

通用控件

通用——START:作业开始;

通用——作业:指定某个作业循环执行;

通用——转换:指定某个转换,加入到作业中来;

通用——设置变量:设置变量,为了转换或者作业中获取变量;

通用——成功:作业完成操作;

通用——DUMMY:空操作,什么也不执行;

邮件——发送邮件:给指定邮箱发送邮件,发件人的账号需要开通第三方发送邮件的功能;

文件管理——复制/移动结果文件:复制/移动文件;

文件管理——创建一个目录:创建指定的目录;

文件管理——删除一个文件:删除指定的一个文件;

文件管理——复制文件:复制指定的文件;

文件管理——删除目录:删除指定的目录;

文件管理——删除多个文件:通过正则表达式批量删除文件;

条件——检查数据库连接:检查数据库是否能够连接通;

条件——检查表是否存在:检查指定的表是否存在;

文件传输——SFTP下载:可以通过SSH进行远程下载文件;

文件传输——SFTP上传:可以通过SSH进行远程上传文件;

文件传输——FTP删除:可以远程删除指定的文件;

转换中常用控件:

输入——Excel输入:从excel文件中读取数据;

输入——文本文件输入:从文本文件中读取数据;

输入——生成随机数:用来生成指定类型的随机数;

输入——自定义数据常量:将值不变的变量存入到此处,方便管理;

输入——获取系统信息:可以获取系统信息(日期、命令行参数);

输入——表输入:从数据库表中读取数据;

输出——Excle输出:注意.xls格式输出行数有限制,一般输出.xlsx最好;

输出——插入/更新:根据指定的匹配字段,可以检测是插入新数据,还是修改旧数据;

输出——文本文件输出:将结果数据输出到文本文件中去;

输出——表输出:将结果数据输出到某个数据库的某个表中;

转换——增加常量:在原数据中将常量值增加新一列;

转换——排序记录:对原数据按照某个字段进行排序;

转换——剪切字符串:对字符串进行截图;

转换——去重复记录:对于某个字段有重复的记录进行过滤;

转换——字段选择:筛选流中的字段,慎用,过滤后后面的控件将无法获取流中筛除的字段了;

流程——空操作:将不需要的数据放到此处,类似垃圾箱;

流程——过滤记录:按照条件进行过滤,类似if-else;

流程——Switch/Case:与java中switch/case一样;

脚本——java代码:执行java代码;

脚本——Javascript代码:执行Javascript代码;

脚本——执行SQL脚本:执行sql;

连接——记录集连接:类似于sql的left join/right join/inner join,但是使用前的数据必须要经过排序;

作业——从结果获取记录:从作业中获取数据;

作业——复制记录到结果:将转换中的结果数据放到作业中去;

作业——获取变量:从作业中获取变量;

作业——设置变量:设置变量,从而让作业中能够获取变量;

建立转换

文件—新建—转换。

新建转换后点击左边的主对象树,然后选择DB连接,建立用以连接数据库。如图所示:

建立数据库连接的过程相当于在数据库管理工具连接数据库。

输入所需同步的两个数据库,点击测试查看连接是否正常

注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。

简单的数据同步/更新

新建表插入

在左边的菜单选择“核心对象”,在核心对象里面选择“输入—表输入”,用鼠标拖放到右边面板。

双击拖进来的表,可对表进行编辑。

新建插入\更新

在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:

双击插入更新,编辑它选中表输入,按住shift键,拖向插入更新。

选中表输入,按住shift键,拖向插入更新。

双击插入更新,更改设置。

查询字段:用来对比的关键字段,kettle会根据它来判断是插入还是更新,一般用id

运行装换

点击运行按钮,测试装换是否成功。

启动完成。

使用作业控制转换

作业可以定时或周期性的执行转换,新建作业。并从左边面板拖入start 和转换。

双击start可以编辑,可以设置执行时间等等

点开装换,可以设置需要执行的转换任务,打开我们保存的转换。

将成功拖到右侧面板,并连接。

这样一个简单的通过作业调度的kettle就算做完了。



推荐阅读
  • 本文介绍了一个免费的asp.net控件,该控件具备数据显示、录入、更新、删除等功能。它比datagrid更易用、更实用,同时具备多种功能,例如属性设置、数据排序、字段类型格式化显示、密码字段支持、图像字段上传和生成缩略图等。此外,它还提供了数据验证、日期选择器、数字选择器等功能,以及防止注入攻击、非本页提交和自动分页技术等安全性和性能优化功能。最后,该控件还支持字段值合计和数据导出功能。总之,该控件功能强大且免费,适用于asp.net开发。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • MySQL多表数据库操作方法及子查询详解
    本文详细介绍了MySQL数据库的多表操作方法,包括增删改和单表查询,同时还解释了子查询的概念和用法。文章通过示例和步骤说明了如何进行数据的插入、删除和更新操作,以及如何执行单表查询和使用聚合函数进行统计。对于需要对MySQL数据库进行操作的读者来说,本文是一个非常实用的参考资料。 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了使用postman进行接口测试的方法,以测试用户管理模块为例。首先需要下载并安装postman,然后创建基本的请求并填写用户名密码进行登录测试。接下来可以进行用户查询和新增的测试。在新增时,可以进行异常测试,包括用户名超长和输入特殊字符的情况。通过测试发现后台没有对参数长度和特殊字符进行检查和过滤。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 我们有(据我所知)星型模式SQL数据库中的数据文件。该数据库有5个不同的文件,扩展名为 ... [详细]
  • java drools5_Java Drools5.1 规则流基础【示例】(中)
    五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]
  • 本文总结和分析了JDK核心源码(2)中lang包下的基础知识,包括常用的对象类型包和异常类型包。在对象类型包中,介绍了Object类、String类、StringBuilder类、StringBuffer类和基本元素的包装类。在异常类型包中,介绍了Throwable类、Error类型和Exception类型。这些基础知识对于理解和使用JDK核心源码具有重要意义。 ... [详细]
  • 如何优化Webpack打包后的代码分割
    本文介绍了如何通过优化Webpack的代码分割来减小打包后的文件大小。主要包括拆分业务逻辑代码和引入第三方包的代码、配置Webpack插件、异步代码的处理、代码分割重命名、配置vendors和cacheGroups等方面的内容。通过合理配置和优化,可以有效减小打包后的文件大小,提高应用的加载速度。 ... [详细]
author-avatar
天佑伈似_倥伯
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有