kettle实战:mysql2hive操作示例

工具:

1.kettle 6.0

2.mysql hive

前期准备:

===最近在尚硅谷看到一个教程是用kettle8 貌似不用导jar包了 >_<

这里默认hive已经可以正常使用:

一、大数据相关jar包

放置路径 :pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp22\lib

这里不一定使用hdp 需要根据hadoop安装方式自行选择

kettle实战:mysql2hive操作示例

 

将下面的紫色jar包导入(主要忘了当时导的啥jar包了 用个compare比较了一下)

kettle实战:mysql2hive操作示例

 

2、配置路径:pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp22

这里将自己hadoop集群的相关配置拿过来

kettle实战:mysql2hive操作示例

3、上述配置完成后需要修改pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\plugin.properties

将红框处替换成自己上面修改的文件夹名

kettle实战:mysql2hive操作示例

 

4、连接测试

kettle实战:mysql2hive操作示例

 

步骤总图

非常简单的一个表输入表输出~

kettle实战:mysql2hive操作示例