EMC存储VNX1或者CX更换SPS常见问题

SPS的全称是 Standby PowerSuply,翻译过来就是后备电源的意思,其实不是完全意义上的电池,电池的英文应该是battery,这个理解有点复杂,如果不理解就当电池好了。主要作用是给SP就是控制器供电,如果机器突然掉电,这个SPS还可以继续提供电力300秒的时间,这段时间内存中的数据就会写到磁盘中,避免内存中的数据丢失。

SPS支持两种,1200W和2200W的电池,下面是1U 1200W SPS的示意图。2U的SPS是2200W,一般VMAX和DMX都使用2200W的电池,但部分VNX也可以使用2200W的电池。

在什么情况下使用2U的SPS?

当使用4U 60块磁盘扩展柜的DAE作为Vault drive的时候,并且Vault drive 是Flash磁盘的时候,使用2U 的SPS,其他情况使用1U的SPS就可以了。而且是Block和File一起的unified架构。

SPS监控线2U和1U的是不同的

2U SPS (RJ-12) port 是一个LAN port,不是WAN port。LAN ports 含有安全的超低电压 (SELV) 集成电路。而WAN port 是 telephone-network voltage (TNV) circuits.

注意,RJ-45 (or TNV-type) 外观和  RJ-12 很相似,区别在于:

  • RJ-45 is an 8-wire modular jack. The RJ-12 is a six-wire modular jack.
  • RJ-45 plugs and jacks are wider than their RJ-12 counterparts - 7/16" vs 3/8".
  • RJ-45 plug won't fit into an R-J12 jack. But an RJ-12 plug will fit into an RJ-45 jack.

这个图片是RJ-12的port

Micro DB-9到RJ12的线,PN为 038-003-085,这个监控线是从SP就是控制器到1U SPS的。遇到过很多情况,就是没有插这个线或者插反了,这样系统中就认不到电池SPS存在。

扫描二维码关注公众号,回复: 15091226 查看本文章

更换SPS的过程其实是很简单的,仔细看看结构,就知道了,拧开前面的螺丝,然后从后面往前推就抽出来了。

经常遇到的问题是SPS更换以后,系统的故障灯还继续亮着,在图形界面上继续显示Fault或者not ready等,如下图所示:

如果还有其他问题,可以 wechat 和我们进一步探讨 wechat: StorageExpert。

从naviseccli -getcurs 可以看到sps的状态是 cabling status is unknow

C:\> naviseccli -h (sp-ipaddress) getcrus

SPE5 Enclosure SPE           *FAULT* 

(Enclosure SPE : Faulted; Enclosure SPE SPS A : Faulted)

SP A State:                 Present

SP B State:                 Present

Enclosure SPE Power A0 State: Present

Enclosure SPE Power A1 State: Present

Enclosure SPE Power B0 State: Present

Enclosure SPE Power B1 State: Present

Enclosure SPE SPS A State:  Present

Enclosure SPE SPS B State:  Empty

Enclosure SPE SPS A Cabling State: Cabling Status is unknown

Enclosure SPE SPS B Cabling State: Cabling Status is unknown

如果电池的LED灯是绿色,Ktcons中的sps是OK状态。 这个VNX或者CX的OE bug。该问题在下面的版本中解决:

VNX1代的05.32.00005.217

  1. Release 29 的 Release 29, Release 28.707, Release 26.031 patch, and Release 23.707
  2. 超过这个版本 R29 p012; R30 p526; and R32 p216

排除了cable和电池的问题,下面是临时解决办法:

1. 重启两个控制器的management server,中间相隔5分钟以上。这个不影响业务。

1)通过setup界面重启

2)命令行重启

Naviseccli -h SPA address networkadmin -restartcimom

Naviseccli -h SPB address networkadmin -restartcimom

不要使用K10governor 来重启managemnt server, 这个有宕机隐患。

过几分钟,到unispere上查看sps的状态是否更新。

2. 重启对端的控制器,注意这里的重启是physical的重启,不是soft的重启(management modle是是sp的一部分,不能拆开的型号)。

  1. 关闭write cache
  2. 运行 shutdownpeersp的命令
  3. 如果sp已经shutdown了,把sps的电源关掉。把sp物理上抽出来。
  4. 过几分钟,sps加电,然后插入sp
  5. 重新打开write cache

3. 对于部分vnx,如果有单独的management module,就不需要重启sp了

  1. 把management module 拔下来
  2. sps断电,等几分钟,sps完全断电
  3. 然后重新给sps加电
  4. 把management module插进去
  5. 等几分钟,sps完全充电以后,查看unisphere的状态。

也有情况听客户讲,重启对端SP不起作用,需要把2个控制器都分别重启,但这个我没有见过,也不是很合理,估计什么地方操作有不当的地方。 

猜你喜欢

转载自blog.csdn.net/m0_72255440/article/details/130024153