mysql-cluster sql节点Keepalived的一次故障处理过程

故障名称

mysql-cluster集群sql节点高可用keepalived的故障处理过程

故障发生时间

2020年5月19日 06:13

故障描述

sql节点的keepalived软件意外停止,导致vip地址失效。进而使mysql-cluster的api无法访问。

故障分析

1、查看keepalived的日志。发现如下内容:
bogus VRRP packet received on eth0 !!!
VRRP_Instance(VI_1) Dropping received VRRP packet…
(VI_1): ip address associated with VRID 51 not present in MASTER advert :
bogus VRRP packet received on eth0 !!!
VRRP_Instance(VI_1) Dropping received VRRP packet…
VRRP_Instance(VI_1) sent 0 priority
VRRP_Instance(VI_1) removing protocol VIPs.
Stopping
mysql-cluster sql节点Keepalived的一次故障处理过程
2、根据日志判断应该是这个keepalived主节点收到的数据包中的vip地址与此节点设置的vip地址不一致。导致了数据包的丢失。
3、经查,本网络内还有其他的keepalived组,其中的virtual_router_id与本组keepalived的virtual_router_id一样,导致了冲突。

处理过程

1、修改keepalived.conf文件中的virtual_router_id值,与另外一组keepalived中的virtual_router_id区分开。
2、重启keepalived服务。

经验总结

1、仔细检查配置文件。
2、提前做好软件部署规划。