IBM DS3200控制器电池(双控)故障处理方案
一、故障定位
1.1.故障信息
Log摘要 Storage Subsystem: SHSJZ-VOICE |
1.2.故障定位
使用IBM管理软件,获取Log ,在Log中报出控制器A电池失效。
经过确认控制器A电池因没电引起告警。
需要更换控制器A电池。
二、故障处理
2.1.先决条件
注意 |
操作时,使用防静电护腕 添加或更换硬件组件之前请作好数据备份。如果部件未正确安装,则可能会导致数据丢失。 |
2.2.准备项
准备确认项 | ||
类型 |
准备项 |
状态 |
硬件 |
笔记本一台 |
已准备就绪 |
网线三根 |
已准备就绪 |
|
交换机一台 |
已准备就绪 |
|
十字螺丝刀一把 |
已准备就绪 |
|
防静电护腕一个 |
已准备就绪 |
|
标签纸若干 |
已准备就绪 |
|
新控制器电池 |
已准备就绪 |
|
软件 |
最新版IBM Storage Manager |
已准备就绪 |
其它 |
||
2.3.操作项
操作项列表 | |||
序号 |
操作项 |
操作内容 |
时间(共计2h) |
1 |
业务数据备份 |
建议客户应用及业务数据备份 |
|
2 |
业务暂停操作 |
确认暂停业务运行 |
|
3 |
连接控制器 |
笔记本通过网线连接交换机 |
15m |
两个控制器通过网线分别连接交换机 | |||
配置好笔记本IP地址 | |||
打开SM客户端 | |||
确认连接两个控制器 | |||
4 |
ASD收集保存 |
通过SM客户端进行ASD(All Support Data)收集和保存 |
30m |
确认ASD(All Support Data)收集保存的数据已经存在 | |||
6 |
物理通路风险 |
登陆主机确认主机的两条物理通路(主机光纤卡至Logical Drive的通道)都是正常的 |
|
7 |
标签纸标识 |
用标签纸对光纤收发两路做唯一标识 |
30m |
确认对光纤标识正确 | |||
8 |
LUN切出操作 |
记录所有LUN对应的控制器 |
|
通过SM客户端软件确认切出LUN的read caching、write caching、Enable write caching without batteries都已经Disable | |||
通过SM客户端软件把需更换电池控制器上的LUN切换到另外一个控制器上 | |||
确认LUN切换操作有效 | |||
9 |
Offline操作 |
通过SM客户端软件对需更换电池控制器进行Offline操作 |
|
确认Offline操作有效 | |||
10 |
更换电池 |
硬件更换操作员佩戴好防静电护腕 |
30m |
拔掉用标签纸做过唯一标识的光纤 | |||
拔出包含故障电池的控制器 | |||
电池物理更换 | |||
确认电池已经正确安装 | |||
插回更换过新电池的控制器 | |||
确认控制器已经有效插回 | |||
插回用标签纸做过唯一标识的光纤 | |||
确认光纤已经正确插回 | |||
11 |
Online操作 |
等待5分钟左右 |
|
通过SM客户端软件Online该控制器 | |||
确认Online操作有效 | |||
12 |
Reset电池 |
等待15分钟左右(15分钟至72小时内) |
|
确认新电池完全充满电; (控制器后部会有绿色灯闪烁,表明在充电,大约15分钟后充满,一般是在15分钟至72小时之内充满) | |||
通过SM客户端软件Reset新电池寿命 | |||
确认新电池已经Resrt | |||
13 |
物理通路风险 |
确认主机的两条物理通路(主机光纤卡至Logical Drive的通道)都是正常的 |
|
14 |
LUN切回操作 |
对照LUN对应的控制器记录,把LUN切换回控制器 |
|
确认LUN切回操作有效 | |||
通过SM客户端软件确认切出LUN的read caching、write caching、Enable write caching without batteries都已经Enable | |||
15 |
确认正常 |
通过SM客户端软件确认无相关告警 |
15m |
16 |
确认业务恢复 |
确认客户业务已经恢复正常 |
|
17 |
清理现场 |
更换电池操作完毕,清理现场,整理准备项所列硬件 |
三、参考信息
转载于:https://blog.51cto.com/xiaozhuang/1354819