Hbase的一些扩展(导入数据)
高效导入数据:
1,javaAPI通过put缓存导入数据
这种方法对于动态的少量的数据导入适用,效率比较慢,会先通过java写入hbase中的缓存中,然后等待满足条件后再刷写落盘
参考链接:缓存方式 https://blog.****.net/asd136912/article/details/100825957
2,通过MR程序读取数据后直接导入到HDFS文件夹中成Hfile文件(bulk loading工具)
这种方式适用于大量的静态的数据,效率较高,不经过内存,直接生成hfile文件
参考:Hadoop权威指南594页