CDH Hbase regionmaster 经常挂掉
问题:hbase regionserver经常挂,如下图:
查看regionserver可以看到是配置不够,导致RegionServer发生FULL GC的时候,STW期间太长,被zookeeper标记为宕机,当RegionerServer GC完成后,苏醒了发现被标记为宕机了,这时候RegionerServer GC就自杀,防止脑裂发生,醒来再自杀。
解决方法,主要修改了hbase的配置,增加了HBase REST Server和HBase Thrift Server的Java堆栈大小: