kettle实战:mysql2hive操作示例
工具:
1.kettle 6.0
2.mysql hive
前期准备:
===最近在尚硅谷看到一个教程是用kettle8 貌似不用导jar包了 >_<
这里默认hive已经可以正常使用:
一、大数据相关jar包
放置路径 :pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp22\lib
这里不一定使用hdp 需要根据hadoop安装方式自行选择
将下面的紫色jar包导入(主要忘了当时导的啥jar包了 用个compare比较了一下)
2、配置路径:pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp22
这里将自己hadoop集群的相关配置拿过来
3、上述配置完成后需要修改pdi-ce-6.0.1.0-386\data-integration\plugins\pentaho-big-data-plugin\plugin.properties
将红框处替换成自己上面修改的文件夹名
4、连接测试
步骤总图
非常简单的一个表输入表输出~