hbase

1.定义与结构
hbase
hbase
同类型的列分为列族,存在不同的文件中,且可以动态增加。
Row key:行键,有序,按位比较的,只要唯一就行了,如果不唯一就是覆盖。
Region是横向切片,按照数据量划分到不同的文件夹。
宽表:列多
高表:行多
store:真正存在hdfs里边
列名等元数据信息存在内存中

2.物理存储
hbase
上面中t4是修改覆盖了t3的数据,取数据返回时取时间戳最大的t4

TimeStamp字段一定要注意,window和linux系统时间调成一样,否则时间戳不一致,数据不一致的任何情况都有可能发生,删除数据删不掉,插入数据看不见。

3.数据模型:
hbase
默认空间下创建表,不需要带上命名空间
自定义的命名空间需要带上才能访问,相当dbo.xxx

不需要定义列,列是动态的,hbase里边的列相当hbase表里的数据
name:张三 这个是一组数据值,所以不需要定义列是什么

表按照rowKey查询,也可以按照rowkey的范围来查询的

hbase
4. 基本架构:
hbase
数据存在hdfs中,hdfs存在linux文件中
master挂了,zookeeper处理数据的增删改查没问题,表级别的增删改查是不行的。
master是管理表结构上的,类似ddl操作

  1. 快速入门
    .