KETTLE的资源库配置及环境部署
kettle的环境部署及资源库配置
1. kettle的环境部署
在使用kettle之前首先要部署JVM环境,就是先将JDK配置好,这样才能正常使用,安装kettle的过程这里就不细说了,在安装好kettle后,在kettle目录下面找到spoon.bat和spoon.sh文件,spoon.sh文件实在linux下启动kettle的启动文件,spoon.bat文件是在windows下启动kettle的启动文件,在windows上直接双击spoon.bat文件即可,在linux下运行spoon.sh脚本即可。
2. 资源库的配置
Kettle的transformation文件和job文件可以选择本地存储和资源库存储,在实际业务中一般都是使用资源库来存储的,下面就介绍一下如何使用。
- 打开kettle后在右上角可以看到“connect”,然后点击Connect
- 点击Connect之后,再点击Repository Manager进入资源库配置界面
- 进入资源库配置界面后,点击添加“add
- 点击add后,再选择Other repository
- 在选择Other Repository后可以看到数据库类型资源库(Database Repository)和文件类型资源库(File Repository),这里根据个人需求或者业务需求来进行选择,一般会选择数据库类型的资源库,这里说一下,选择Database Repository后续可以通过资源库中的元数据来提取数据与数据之间的血缘关系,这个也是根据业务需求来看,后续会介绍元数据库中的数据内容,选择好资源库类型后,点击Get Started。
- 在点击Get Started后,再继续点击Database Connect即可,显示名称(Display Name)可以不用填写
- 在点击数据库连接后,会出现下图中的界面,我们选择“new”,及新建一个资源库,下图中的绿框中的内容是已经建立的资源的列表。
- 进入新建数据库连接界面后,我们可以看到列表里面有多种数据库可以进行连接,用作为资源库,这里我们以mysql作为例子,在选择mysql后我们可以看到右侧会出现数据库连接的jdbc参数配置界面,按照提示信息填入相关参数即可,再填选完配置参数后,要将连接名称填写上,然后点击测试,看看是否能正常与数据库进行连接,测试成功后,就可以点击确定,资源库的配置就完成了。