使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

使用Sqoop进行数据导入

 

配置ssh的免密登录

终端输入:sudo service ssh restart重启ssh服务。

终端输入:sudo service mysql start开启mysql。

配置免密登陆:rm -rf ~/.ssh/再输入ssh-******敲三下回车

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

输入ssh-copy-id [email protected]

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

输入yes,需要输入password的地方输入[email protected]即可,以后启动hdfs的时候就不需要多次输入密码了。 

 

1.导入到hdfs中

在终端中输入:start-dfs.sh

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

 输入jps查看进程:

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

之后输入:start-yarn.shk开启yarn

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

输入jps查看

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

之后输入:sqoop import --connect jdbc:mysql://localhost:3306/lydsj --username root -P --table tbl_gender --target-dir /mysql/output --m 1将数据库中的数据导入到hdfs的目录下,过程中要输入数据库密码(我的为000000)。需要等待一段时间。

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

使用hadoop fs -cat /mysql/output/part-m-00000查看导入的结果

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

 

2.导入到hbase中

在开启了hdfs和yarn的情况下,输入:zkServer.sh start开启Zookeeper,之后输入start-hbase.sh开启hbase。

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

输入jps查看进程:

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

在终端中输入hbase shell

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

输入:create 'tbl_dim','info'创建一张表

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

 输入quit退出hbase shell

然后输入命令sqoop import -m 1 --connect jdbc:mysql://localhost:3306/lydsj --username root --password 000000 --table tbl_dimensioncat --hbase-table tbl_dim --columns DIMCATID,DIMENSIONNAME,MEMO --column-family info --hbase-row-key DIMCATID

将数据导入到Hbase中

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

再在终端输入habse shell然后在shell中输入scan 'tbl_dim'查看表中的内容

使用sqoop工具将数据从mysql数据库导入到HDFS和Hbase

结束。