HANA hdbindexserver停电后启动问题

HANA hdbindexserver停电后启动问题

问题描述:

有我们的5 + 1个节点HANA细胞簇停电。HANA hdbindexserver停电后启动问题

我们启动了服务器后,试图启动HANA DB。

HDB在开始sidadm身份,我们可以在节点2-3-4-5上看到:

FAIL: process hdbindexserver HDB Indexserver not running 

所以当然想用手开始hdbindexserver与sidadm身份:

cd /usr/sap/SIDADM/HDB0x/exe; ./hdbindexserver 

但这只是产生错误:

/usr/sap/SIDADM/HDB0x/foobar003/trace> cat indexserver_alert_foobar003.trc 
... 
[14268]{-1}[-1/-1] 2017-10-09 19:55:34.593776 e TrexNet   Communication.cpp(00501) : no internal interface found 
[14287]{-1}[-1/-1] 2017-10-09 19:56:01.428226 e Checkpoint  CheckpointMgr.cc(00244) : Skip versions garbage collection savepoint: transaction distribution work failure: snapshot timestamp synchronization failed 
[14287]{-1}[-1/-1] 2017-10-09 19:56:22.467184 e Row_Engine  transdtx.cc(01410) : Unexpected ltt exception thrown: transaction distribution work failure (at foobar/ptime/storage/tm/transdtx.cc:1410) 
[14287]{-1}[-1/-1] 2017-10-09 19:56:22.467427 f PersistenceLayer PersistenceController.cpp(00679) : startup failed exception 1: no.71000145 (ptime/storage/tm/transdtx.cc:1512) 
    snapshot timestamp synchronization failed 
... 

这些IP已启用。有1个TB的RAM。

问题:什么可能导致hdbindexserver无法启动?

貌似IndexServer进程无法再结合内部网络接口:

Communication.cpp(00501) : no internal interface found

我会考虑其他跟踪文件和系统日志检查是否配置NI可用● 。

似乎持久性存储(数据和日志文件所在的磁盘)在时间内没有响应,因此超时。你可以检查您是否可以从服务器访问数据文件和日志文件。

还检查是网络I/O慢或磁盘I/O缓该服务器,导致同步超时上。

你可以尝试完全停止系统,并尽量把组屋刚刚那台服务器上的第一次检查,如果上述问题的存在。