Hbase的一些扩展(导入数据)

高效导入数据:

Hbase的一些扩展(导入数据)

 

1,javaAPI通过put缓存导入数据

这种方法对于动态的少量的数据导入适用,效率比较慢,会先通过java写入hbase中的缓存中,然后等待满足条件后再刷写落盘

参考链接:缓存方式   https://blog.****.net/asd136912/article/details/100825957

2,通过MR程序读取数据后直接导入到HDFS文件夹中成Hfile文件(bulk loading工具)

这种方式适用于大量的静态的数据,效率较高,不经过内存,直接生成hfile文件

参考:Hadoop权威指南594页