HBASE概述及集群安装

HBASE概述

  • HBASE是一个非关系型的数据库、对存储的数据格式要求不严格。可以存储非结构化或半结构化数据。(遵从数据库范式设计的数据库是关系型数据库、像XML、HTML、JSON格式的数据可以是半结构化数据、图片是非结构化数据)

  • 关系型数据库,以行格式存储数据,寻址到第一行数据,依次一行接一行的存储数据;HBASE数据库以列格式存储数据,每寻址到一个列地址,就存储一列数据。比较发现,数据写入的效率,行存储比列存储效率高。读取全部字段时,行读取比列读取效率高,列读取涉及一个寻址的问题。但读取指定字段时,列读取比行读取效率高。

  • HBASE以行键和列族的方式存储数据,rowkey相当于关系数据库中的主键,列族的字段个数不固定相等,支持动态扩展。行键默认按照字典顺序排列。
    HBASE安装

  • 首先yangjjhost、yangjjhost02、yangjjhost03主机zookeeper集群已经启动 HBASE概述及集群安装
    HBASE概述及集群安装HBASE概述及集群安装

  • 然后启动伪分布式Hadoop或完全分布式Hadoop
    由于Hadoop加入了环境变量,所以可以在任意目录下执行start-all.sh 来启动hadoop
    HBASE概述及集群安装

  • 再次是Hbase的配置
    编辑hbase-env.sh
    HBASE概述及集群安装
    export JAVA_HOME=/usr/java/jdk1.8.0_111
    export HBASE_MANAGES_ZK=false
    修改这两个地方

  • 编辑vim hbase-site.xml,添加如下配置:
    HBASE概述及集群安装

  • 编辑vim regionservers,添加HBase从节点
    HBASE概述及集群安装

  • 最后启动HBase
    仅在第一台节点启动Hbase,后面两台机器会自动关联启动,第一台节点启动了HMaster服务和HReginServer服务。
    HBASE概述及集群安装
    后面两台机器只启动了HRegionServer
    HBASE概述及集群安装
    若第一台机器上的HMaster服务崩了,担心数据丢失,可以在后面两台机器的任意一台机器上,单独启动HMaster。HBase的HMaster服务不限制个数
    HBASE概述及集群安装
    HBase可视化管理控制台
    HBASE概述及集群安装