HBase表没有像预期的那样收缩

问题描述:

我有一台独立的HBase(没有hadoop)实例在单台机器上运行。HBase表没有像预期的那样收缩

它最初是在32G,起壳定义 更新一些列后:(!不被新的数据引起)

alter 'table', {NAME =>'mycol', TTL => <two_months>} 
alter 'table', {NAME =>'mycol', COMPRESSION => 'GZ'} 

数据存储已经从32G过夜培养至51G。由于大部分条目都比2个月大,我期望表格会缩小。另外,我已经要求对列进行压缩。

我想了解为什么运行alter命令导致大规模增长,我能期待它再次缩小吗?

我曾期待它在下一次重大压缩时缩小,它已经> 24小时,而我 感到惊讶,它尚未发生。

+0

您是否尝试过手动运行表格的主要压缩?此外,你可能想要徘徊在HTML管理页面 – juhanic

对于TTL问题只是强制一个重大的压缩,因为juhanic说。压缩比较麻烦,但由于hbase没有自动合并块的方法(在jira中有关于它的问题),块的数量(区域)不会改变。当我切换压缩时,我更喜欢导出 - >截断 - >重新导入数据。小提示:如果大小是个问题,最容易的优化是降低VERSIONS值(如果可能的话降低到1)。我想你已经做到了。

+0

谢谢,使用版本是一个选项,ttl是可取的。 – Joel