HANA hdbindexserver停电后启动问题
问题描述:
有我们的5 + 1个节点HANA细胞簇停电。HANA hdbindexserver停电后启动问题
我们启动了服务器后,试图启动HANA DB。
HDB在开始sidadm身份,我们可以在节点2-3-4-5上看到:
FAIL: process hdbindexserver HDB Indexserver not running
所以当然想用手开始hdbindexserver与sidadm身份:
cd /usr/sap/SIDADM/HDB0x/exe; ./hdbindexserver
但这只是产生错误:
/usr/sap/SIDADM/HDB0x/foobar003/trace> cat indexserver_alert_foobar003.trc
...
[14268]{-1}[-1/-1] 2017-10-09 19:55:34.593776 e TrexNet Communication.cpp(00501) : no internal interface found
[14287]{-1}[-1/-1] 2017-10-09 19:56:01.428226 e Checkpoint CheckpointMgr.cc(00244) : Skip versions garbage collection savepoint: transaction distribution work failure: snapshot timestamp synchronization failed
[14287]{-1}[-1/-1] 2017-10-09 19:56:22.467184 e Row_Engine transdtx.cc(01410) : Unexpected ltt exception thrown: transaction distribution work failure (at foobar/ptime/storage/tm/transdtx.cc:1410)
[14287]{-1}[-1/-1] 2017-10-09 19:56:22.467427 f PersistenceLayer PersistenceController.cpp(00679) : startup failed exception 1: no.71000145 (ptime/storage/tm/transdtx.cc:1512)
snapshot timestamp synchronization failed
...
这些IP已启用。有1个TB的RAM。
问题:什么可能导致hdbindexserver无法启动?
答
貌似IndexServer进程无法再结合内部网络接口:
Communication.cpp(00501) : no internal interface found
我会考虑其他跟踪文件和系统日志检查是否配置NI可用● 。
答
似乎持久性存储(数据和日志文件所在的磁盘)在时间内没有响应,因此超时。你可以检查您是否可以从服务器访问数据文件和日志文件。
还检查是网络I/O慢或磁盘I/O缓该服务器,导致同步超时上。
你可以尝试完全停止系统,并尽量把组屋刚刚那台服务器上的第一次检查,如果上述问题的存在。