ImageVerifierCode 换一换
格式:DOCX , 页数:19 ,大小:950.21KB ,
资源ID:5540097      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5540097.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(KETTLE使用说明及带输入参数的java调用.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

KETTLE使用说明及带输入参数的java调用.docx

1、KETTLE使用说明及带输入参数的java调用ETL工具kettle使用说明1 简介ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),Kettle是一款国外开源的etl工具,纯java编写,数据抽取高效稳定。2 运行环境:OS:Window、Linux、Unix均可Jdk1.4以上3 开始使用:Kettle可以在http:/kettle.pentaho.org/网站下载。下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。(本文着重介绍kettle3.2.0稳定版)Spoon 是一个图形用户界面,在不同平台上运行Spoon需要不

2、同的脚本:Spoon.bat: 在windows 平台运行Spoon(或直接点击Kettle.exe)。Spoon.sh: 在Linux、Apple OSX、Solaris 平台运行Spoon。登陆一般选择没有资源库:Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。4 转换(Transformation) 新建一个转换kettle默认transformation文件保存后后缀名为ktr 新建数据库连接(此链接也可在用到的节点处配置)填写数据源配置内容点击Test测试连接成功: 核心对象切换到核

3、心对象,菜单列出的是Transformation中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。并且可通过shift+鼠标拖动,实现环节之间的连接。常用节点介绍(红色节点后面逐一演示)类别 环节名称 功能说明 输入 文本文件输入 从本地文本文件输入数据 表输入 从数据库表中输入数据 获取系统信息 读取系统信息输入数据 输出 文本文件输出 将处理结果输出到文本文件 表输出 将处理结果输出到数据库表 插入/更新 根据处理结果对数据库表机型插入更新,如果数据库中不存在相关记录则插入,否则为更新。会根据查询条件中字段进行判断 更新 根据处理结果对数据库进行更新,若需要更新的数据在数据库表中

4、无记录,则会报错停止 删除 根据处理结果对数据库记录进行删除,若需要删除的数据在数据库表中无记录,则会报错停止查询 数据库查询 根据设定的查询条件,对目标表进行查询,返回需要的结果字段 流查询 将目标表读取到内存,通过查询条件对内存中数据集进行查询 调用DB存储过程 调用数据库存储过程 转换 字段选择 选择需要的字段,过滤掉不要的字段,也可做数据库字段对应过滤记录 根据条件对记录进行分类排序记录 将数据根据某以条件,进行排序空操作 无操作增加常量 增加需要的常量字段脚本 Modified Java Script Value扩展功能,编写JavaScript脚本,对数据进行相应处理映射 映射(子

5、转换) 数据映射作业 Sat Variables设置环境变量Get Variables获取环境变量 表输入双击拖动到工作面板上的表输入结点,选择(或者新建)所需要的数据库连接,点击获取SQL查询语句或自行编辑SQL。若需根据前一步获取数据进行查询,可用“?”号代替,变量顺序与前一节点相同 字段选择界面如下:选择和修改:指定需要流到输出流中的字段的精确顺序和名称删除:指定从输出流中删除的字段(以后输出流将不会获取到此数据)元数据:修改元数据字段的名称、类型、长度和精度 插入/更新如下图,表示当原表的id=new_test.id时,比较createdate和account,若不同就进行更新,如果没

6、有此id就插入该数据 运行Transformation:一个简单的Transformation如下:这里可以不用配置直接启动执行结果中可以查到执行步骤以及输出日志5 任务(Job) 新建一个Jobkettle默认job文件保存后后缀名为kjb 核心对象菜单列出的是Job中可以调用的环节列表,可以通过鼠标拖动的方式对环节进行添加。每一个环节可以通过鼠标拖动来将环节添加到主窗口中。并可通过shift+鼠标拖动,实现环节之间的连接。常用节点介绍(红色节点后面逐一演示)类别环节名称功能说明START开始DUMMY结束Transformation引用Transformation流程Job引用Job流程S

7、hell调用Shell脚本SQL执行sql语句FTP通过FTP下载Mail发送邮件Table exists检查目标表是否存在,返回布尔值File exists检查文件是否存在,返回布尔值Wait for等待时间,设定一段时间,kettle流程处于等待状态Javascript执行JavaScript脚本Create file创建文件Delete file删除文件Wait for file等待文件,文件出现后继续下一个环节File Compare文件比较,返回布尔值Zip file压缩文件为ZIP包 Start结点一个Job任务要求要有一个start结点作为工作流入口。如图,设置任务流开始执行的时

8、间,可以循环执行,该图定义为每天16:32执行一次 Transformation结点调用一个Transformation,选择指定的Transformation文件(*.ktr) Mail结点配置好目的方和发送方的地址以及SMTP服务器地址此处验证是发送方的用户信息: 运行Job:一个简单的Job流程如下:开始结点进入流程,到目标时刻时执行DBUpdate,成功后会发送邮件6 Java调用(注:此处用的是kettle3,kettle4的调用有所不同)Jar包引用调用Kettle需要用到的基本jar包如下:其他jar包可根据具体的transformation或job做添加,这些jar包基本都可以

9、从data-integration目录中的libext文件夹下找到。调用本地的transformation示例代码如下:/* * 调用本地trans * * param transFileName * trans文件路径 * throws KettleException */ public void callNativeTrans(String transFileName) throws KettleException / 初始化 EnvUtil.environmentInit(); StepLoader.init(); / 转换元对象 TransMeta transMeta = new Tr

10、ansMeta(transFileName); / 转换 Trans trans = new Trans(transMeta); / 执行转换 trans.execute(null); / 等待转换执行结束 trans.waitUntilFinished(); 调用本地的job示例代码如下:/* * 调用本地job * * param jobFileName * job文件路径 * throws KettleException */ public void callNativeJob(String jobFileName) throws KettleException / 初始化 EnvUti

11、l.environmentInit(); JobEntryLoader.init(); StepLoader.init(); / 日志TransTest.log最终会出现在项目根目录下 LogWriter log = LogWriter.getInstance(TransTest.log, true, LogWriter.LOG_LEVEL_DETAILED); / job元对象 JobMeta jobMeta = new JobMeta(log, jobFileName, null); / job Job job = new Job(log, StepLoader.getInstance()

12、, null, jobMeta); jobMeta.setInternalKettleVariables(job); / 执行job job.execute(); / 等待job执行结束 job.waitUntilFinished(); 带参数的transformation调用做这样一个transformation(将传入的参数输出到一个文本文件中):获取系统信息中作如下配置: 示例代码如下:/* * 带参数的transformation调用 * * param transFileName * trans文件路径 * param params * 参数 * throws KettleExcep

13、tion */ public static void callNativeTrans(String transFileName,String params) throws KettleException / 初始化 EnvUtil.environmentInit(); StepLoader.init(); / 转换元对象 TransMeta transMeta = new TransMeta(transFileName); / 转换 Trans trans = new Trans(transMeta); /此处为输入的参数,也可以通过参数传进方法中 /String s = 123; / 执行转换 trans.execute(params); / 等待转换执行结束 trans.waitUntilFinished();

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1