首页编程正文内容

Kettle使用手册及测试案例

编程

更新时间：2025-06-08 06:40:40 43

admin 管理员组

文章数量: 1087135

2023年12月18日发(作者：animate软件下载)

一、【kettle】window安装与配置

1、下载kettle包，并解压

/projects/data-integration/

2、安装jdk，并配置java环境

a).打开我的电脑--属性--高级--环境变量

b).新建系统变量JAVA_HOME和CLASSPATH

变量名：JAVA_HOME

变量值：C:Program FilesJavajdk1.7.0[具体路径以自己本机安装目录为准]

变量名：CLASSPATH

变量值：.;%JAVA_HOME%;%JAVA_HOME%;

c). 选择“系统变量”中变量名为“Path”的环境变量，双击该变量，把JDK安装路径中bin目录的绝对路径，添加到Path变量的值中，并使用半角的分号和已有的路径进行分隔。

变量名：Path

变量值：%JAVA_HOME%bin;%JAVA_HOME%jrebin;

3、配置kettle环境

在系统的环境变量中添加KETTLE_HOME变量，目录指向kettle的安装目录：D:kettledata-integration

4、启动spoon

Windows直接双击批处理文件具体路径为：

Linux 则是执行,具体路径为：

~/kettle/data-integration/

二、使用Kettle同步数据

同步数据常见的应用场景包括以下4个种类型：

➢只增加、无更新、无删除

➢只更新、无增加、无删除

➢增加+更新、无删除

➢增加+更新+删除

只增加、无更新、无删除

对于这种只增加数据的情况，可细分为以下2种类型：

1) 基表存在更新字段。

通过获取目标表上最大的更新时间或最大ID，在“表输入”步骤中加入条件限制只读取新增的数据。

2) 基表不存在更新字段。

通过“插入/更新”步骤进行插入。

插入/更新步骤选项：

只更新、无增加、无删除

通过“更新”步骤进行更新。

更新选项：

增加+更新、无删除

通过“插入/更新”步骤进行插入。

区别是“插入/更新步骤”中的选项，去掉“不执行任何更新”的勾选：

增加+更新+删除

这种数据同步情况，可细分为以下2种情况：

1) 源库有表保存删除、更新和新增的信息。

通过条件判断，分别进行“插入/更新”和“删除”即可，如下图所示。

2) 源库没有保存增删改信息

Kettle提供了一种对比增量更新的机制处理这种情况，可通过“合并记录”步骤实现，该步骤的输入是新旧两个数据源，通过关键字进行数据值比对，对比结果分为以下4种类型：

“Identical”: 关键字在新旧数据源中都存在，域值相同

“changed”: 关键字在新旧数据源中都存在，但域值不同

“new”: 旧数据源中没有找到关键字

“deleted”: 新数据源中没有找到关键字

两个数据源的数据都进入下一步骤，上述4种结果类型作为输出表的标志字段进行保存。

以下为示例：

➢源数据库测试脚本

create table k1 (f1 varchar2(200),f2 varchar2(200))

truncate table k1;

insertinto k1(f1,f2) values('1','11');

insert into k1(f1,f2) values('2','22');

insert into k1(f1,f2) values('5','5');

commit;

➢目标数据库测试脚本

create table k1 (f1 varchar2(200),f2 varchar2(200))

truncate table k1;

insert into k1(f1,f2) values('1','1');

insert into k1(f1,f2) values('2','2');

insert into k1(f1,f2) values('3','3');

insert into k1(f1,f2) values('4','4');

commit;

合并过程如下：

其中“合并记录”步骤的选项：

执行后，查询K1_TEST结果如下：

可以看到，该结果表的BZ字段保存了更新、删除、新增的记录信息，通过条件分支即可分别对这些记录进行相应的处理。

“条件”选项：

小结

Kettle提供了可视化的设计工具，基本上可通过拖拉配置的方式实现以上4种类型的数据同步，操作上相对较为简单。

数据同步的性能与源数据库、目标数据库以及执行Kettle转换操作的主机相关，在笔者的测试环境上（源数据库和目标数据库部署在双核CPU/4G内存的PC机上、执行Kettle转换操作的主机配置为双核CPUx2/4G内存，JVM内存堆栈为256M）、最后一种类型的数据同步，15w的数据，在3分钟内可以完成。

三、案例

1，把172.17.100.189 中的ca__txqdjb 数据同步到 172.16.1.199中的_txqdjb中。 6w级数据

2，把172.17.100.189 中的ca__jcdjb 数据同步到 172.16.1.199中的_jcdjb中。

14w级数据

3,连接异构数据库,读取MySql数据保存到Oracle数据库中；如果数据转换过程中有异常，可以记录异常信息（可以记录到文件或者数据中，通过二次开发，可以实时以短信的形式提醒）

4,异常日志：

备注：

表输入支持SQL读取数据，支持多表查询。

四、【kettle】JDBC连接oracle报找不到驱动

初次接触kettle，环境都配置好以后，启动kettle的spoon，新建作业，配置jdbc的oracle数据源连接，报找不到驱动。

解决办法：

1、下载包

2、将该包拷贝到kettle的 kettlepdi-ce-5.0.1.A-stabledata-integrationlibswt或者kettlepdi-ce-5.0.1.A-stabledata-integrationlib 路径下都可以。

3、重启kettle，重新配置数据源连接。问题解

五、【kettle】JDBC连接mysql报找不到驱动

初次接触kettle，环境都配置好以后，启动kettle的spoon，新建作业，配置jdbc的oracle数据源连接，报找不到驱动。

解决办法：

1、下载包

2、将该包拷贝到kettle的 kettlepdi-ce-5.0.1.A-stabledata-integrationlibswt或者kettlepdi-ce-5.0.1.A-stabledata-integrationlib 路径下都可以。

3、重启kettle，重新配置数据源连接。问题解

本文标签：数据数据库数据源步骤配置

版权声明：本文标题：Kettle使用手册及测试案例内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://roclinux.cn/b/1702905591a435421.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

MySQL5.6.11安装步骤（Windows7 64位Window XP 32位）

编程

2月前

MySQL5.6.11安装步骤（Windows7 64位Window XP 32位） 1. 下载MySQL Community Server 5.6.11 2.解压MySQL压缩包将以下载

《DeepSeek R1 人工智能大模型最简安装步骤》：此文为AI自动生成

编程

2月前

《DeepSeek R1 最简安装步骤》一、Windows系统二、macOS系统三、Linux系统 DeepSeek R1最简安装可以借助Ollama工具来进行，以下是在不同系统中的安装步骤：

手机可以打开MySQL的软件_太牛逼了！一款软件几乎可以操作所有的数据库!

编程

2月前

下载与安装 DBeaver 社区版可以通过官方网站或者 Github 进行下载。两者都为不同的操作系统提供了安装包或者解压版，可以选择是否需要同时安装 JRE。另外，官方网站还提供了 DBeave

Win7旗舰版64位系统正确安装Genymotion模拟器步骤全过程

编程

2月前

（1）先去官网（http:www.genymotion）注册并登陆这里就不细说了，之后点那个Individual->BASIC的免费版的（2）下载第一个（带VirtualBox的）（3）在安装Genoymotion之前需要先

Windows 上安装 Typora 1.9.5 的详细步骤【实测有效】

编程

2月前

1. 官网首先下载 Typora 的安装包：官网(国内可能打不开)、国内站选择你需要的版本下载，我下载了目前最新可用版本 1.9.5（或使用我下面提供的安装包&

Windows Linux 子系统安装步骤

编程

2月前

准备一、启用「适用于Linux的Windows子系统」功能方法一： Win10搜索「控制面板」打开选择「程序和功能」项左上角「启用或关闭Windows功能」翻到最下方选择「适用于Lin

bluecam连接步骤说明_Netgear美国网件路由器登陆设置说明

编程

2月前

本文详解美国网件Netgear路由器登录说明：登录和配置Netgear路由器需要知道两件东西： 1；Netgear路由器的登录IP地址 2；登录用户名和密码本指南将为你展示两种设备如何登录Netgear路由器。在配置路由器之前，我们先

如果忘记了MySQL数据库的密码怎么办

编程

2月前

解决忘记了数据库密码的办法数据库如果出现以下状况应该怎么办？（一）、给MySQL设置环境变量1.找到MySQL管理程序所在目录；更改环境变量如下&am

Windows Embedded Compact7 XP sp3 安装步骤

编程

2月前

Windows Embedded Compact 7 XP sp3 安装步骤： Step1. 安装Visual Studio 2008 选择[Default]安装选项即可，然后按照安装提示Ne

安卓OKhttp请求接口数据失败,postman也失败,用浏览器却能正常请求数据

编程

2月前

实现需求的时候用OKhttp请求数据一直报服务器500错误,用postman请求也是这样,但是拼接后的网址放浏览器中却能得到json数据…后面代码,postman都换get请求也是失败,最后又排查了各种问题.没有结果问了后端大佬… 加上请求

数据库死锁了怎么办

编程

2月前

今天看书的时候，书中写到了到了数据库解决死锁的几个方法，特此做个笔记死锁是个啥？ 一句话概括就是，有两个人叫甲和乙，又两个资源叫

Linux网络之数据链路层协议

编程

2月前

目录数据链路层 MAC地址与IP地址数据帧 ARP协议 NAT技术代理服务器正向代理反向代理上期我们学习了网络层中的相关协议，为IP协议。IP协议通过报头中的目的IP地址告知了数据最

windows下安装DB2数据库以及使用Aqua Data Studio链接数据库

编程

2月前

本文只是作为自己的心得体会，不具有一般性！ 1、其实安装DB2数据库还是比较简单的，一般都是直接下一步下一步就可以了，只是有些地方需要注意。我安装的DB2数据库版本如下图所示： 2、拿到数据库的版本之后，解压缩，如下图的目录结构：然后点击

U盘插入遭遇格式化提示？别急，数据还能救！

编程

2月前

现象描述当U盘插入电脑，满怀期待地点开却遭遇格式化提示，这一幕想必让不少用户心头一紧。U盘作为便携存储设备，承载着大量重要数据，突如其来的格式化要求

ROS开发之如何将树莓派采集的雷达、IMU数据在虚拟机rviz中显示？

编程

2月前

文章目录 0.前言1.获取IP和计算机名2.配置hosts文件3.配置.bashrc文件4.测试数据显示 0.前言树莓派是小型计算机，可以作为移动机器人的控制器，随机器人运动&#xff0

如何在Windows和centOS系统之间实现复制粘贴？步骤如下

编程

20天前

如何在Windows和centOS系统之间实现复制粘贴？只需简单几步即可！ vmtools安装 vmtools安装安装vmtools步骤： 1.进入centOS 2.点击

2022年的电脑能装win7系统吗_2022年的组装电脑装win7详细分析安装步骤

编程

19天前

2022年的电脑能装win7系统吗？2022年的电脑可以安装Win7，但存在一些限制和挑战。2022年的电脑基本上是12代处理器，需要特定的条件和步骤才能安装win7，并且只能采用独立显卡，因为没有集成显卡驱动。另外注意目前2022年的电脑

免费教学Windows Server评估版永久转换为数据中心版攻略

编程

19天前

哈喽大家好，欢迎来到虚拟化时代君（XNHCYL），收不到通知请将我点击星标！“ 大家好，我是虚拟化时代君，一位潜心于互联网的技术宅男。这里每天为你分享各种你感兴趣的技术、教程、软件、资源、福利…（每天更新不间断，福利不见不散）第一章、

php 股票数据 sina,腾讯股票接口、和讯网股票接口、新浪股票接口、雪球股票数据、网易股票数据...

编程

18天前

腾讯股票接口： 分时图 http:data.gtimgflashdatahushenminutesz000001.js?maxage110&0.28163905744440854 五天分时图 htt

虚拟机中创建Windows-详细步骤

编程

12天前

创建虚拟机 1. 创建新的虚拟机 2. 选择【自定义】新建，在点击【下一步】 3. 默认设置，点击【下一步】 4. 选择稍后安装操作系统，点击【下一步】 5. 根据需求选择

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

Kettle使用手册及测试案例

更多相关文章

MySQL5.6.11安装步骤（Windows7 64位Window XP 32位）

《DeepSeek R1 人工智能大模型最简安装步骤》：此文为AI自动生成

手机可以打开MySQL的软件_太牛逼了！一款软件几乎可以操作所有的数据库!

Win7旗舰版64位系统正确安装Genymotion模拟器步骤全过程

Windows 上安装 Typora 1.9.5 的详细步骤【实测有效】

Windows Linux 子系统安装步骤

bluecam连接步骤说明_Netgear美国网件路由器登陆设置说明

如果忘记了MySQL数据库的密码怎么办

Windows Embedded Compact7 XP sp3 安装步骤

安卓OKhttp请求接口数据失败,postman也失败,用浏览器却能正常请求数据

数据库死锁了怎么办

Linux网络之数据链路层协议

windows下安装DB2数据库以及使用Aqua Data Studio链接数据库

U盘插入遭遇格式化提示？别急，数据还能救！

ROS开发之如何将树莓派采集的雷达、IMU数据在虚拟机rviz中显示？

如何在Windows和centOS系统之间实现复制粘贴？步骤如下

2022年的电脑能装win7系统吗_2022年的组装电脑装win7详细分析安装步骤

免费教学Windows Server评估版永久转换为数据中心版攻略

php 股票数据 sina,腾讯股票接口、和讯网股票接口、新浪股票接口、雪球股票数据、网易股票数据...

虚拟机中创建Windows-详细步骤

发表评论

推荐文章

javascript - Google Maps display route from json - Stack Overflow

javascript - Nodemailer does not send the text with line breaks - Stack Overflow

go - How to gracefully terminate a process on Windows, similar to SIGTERM? - Stack Overflow

javascript - multiple angular material table in single page pagination issue - Stack Overflow

重置win11开始菜单解决奇怪问题

热门文章

user interface - JavaScript encryption (or obfuscation) of client-side data structures - Stack Overflow

javascript - HTML5 Content Editable paragraph after list - Stack Overflow

javascript - Collapsing table rows with multiple tbody elements - Stack Overflow

javascript - How to stop swiper slider when autoplay activated and reaching end of slide? - Stack Overflow

javascript - Is there any way to run cypress open and only include test files containing a key word? eg. lifecycle from domains-

javascript - framework7 prevent caching pages data - Stack Overflow

MSDN微软原版软件

老包菜U盘安装Win7系统指南

夸克网盘卸载不干净导致电脑中仍存在夸克网盘虚拟驱动器

Word空白页怎么都删除不掉？亲测有效

最新文章

javascript - How do I toggle the readonly attribute of all child element with jquery - Stack Overflow

javascript - Might it be possible to block an entire US state from accessing my site, using PHP? - Stack Overflow

c++ - Is dereferencing std::span::end always undefined? - Stack Overflow

javascript - Delay function execution if it has been called recently - Stack Overflow

javascript - Google Maps Autocomplete List - Stack Overflow

【教程】Python Flask快速学习

国内可用chatgpt中文版镜像网站最新合集在线网页版-202562

【Windows默认】编码格式修改

系统启动U盘制作

U盘重装win11系统专业版—启动盘制作与安装

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA