hadoop集群进行分布式数据库hbase操作
一:构建java工程项目
1:生成普通的工程文件,打开Eclipse,点击左上角的File——>new——>other——>java project——>输入项目名称即可完成项目的创建。
2、新建文件夹lib,右击项目——>new——>folder——>输入文件夹名字“lib”即可完成文件夹的创建。
3、导入Jar包,将集群中hbase-1.2.3-bin\hbase-1.2.3\lib下面的所有jar包导入新建的lib文件夹下,然后将Lib下所有Jar包全选,右击选择build path——>add to build path。
4、新建resource文件夹,在resource文件夹下新建hadoop和hbase文件夹,将xml文件放入此文件夹,具体如下图所示:
5、修改本机hosts文件,hosts文件在C:\Windows\System32\drivers\etc下,具体如下图所示:
二:开发HBase应用程序
1、HBaseConfiguration(此处的create()方法会从classpath中查找hbase-site.xml文件,如果没有找到,将会使用默认的hbase-default.xml)
2、connection(connection类负责查找HMaster、定位HRegion在集群中的位置并进行缓存,Table和Admin实例也需要通过该类进行获取数据)
3、配置连接hbase(配置中的参数来自于hbase的配置文件hbase-site.xml文件)
4、创建表
5、修改表——增加列族、删除列族
6、列出数据库中所有表
7、查看表结构并写主函数进行创建表
8、启动集群,顺序依次是:zookeeper——>hadoop——>hbase,启动完成后使用jps查看启动是否成功(此处我以第一台为例进行查询,所有节点全部启动成功)。
9、完成上述操作,开启启动程序进行测试。
10、通过Table接口和Put类向socre01表中插入一些数据。
11、启动程序进行插入数据。
12、查看插入结果。
13、使用Get类完成多种不同情况下的查询。
14、启动程序,查看查询结果。
15:、使用Scan 、ResultScanner完成全表扫描。
16、启动程序,查看扫描结果。
至此已经完成hbase的操作,如有不足,希望评论我进行改正