2021-03-26

数据中心硬件设备全生命期管理

                                   -鹰眼视角

 

数据中心硬件设备包括服务器存储网络交换机等设备,为生产业务系统提供最基础的计算资源,存储资源以及网络资源。硬件设备的可靠性、性能稳定性以及故障之后问题定位的精准度等特性都直接影响着整个系统运行,一个高效、功能全面的硬件设备全生命周期管理平台是至关重要的。

 

全生命周期就是指设备采购一直到下线的过程,整个过程可以分为采购,上线,管理,下线四个阶段,四个阶段相互关联,形成一个闭环周期管理。

 

 

 

采购流程

  • 设备报废触发采购流程;
  • 供应商供货,
  • 验收配置是否符合规范;
  • 采集资产信息,
  • 将信息录入资产管理系统;
  • 管理机房空间,申请设备上架

 

设备上线

  • 完成资产验收之后,对设备硬件进行标准化的配置;
  • 对设备软件进行标准化配置;
  • 系统运行之前,对软件、硬件配置进行合规性检查;
  • 全程可以做到服务器零接触;

上线后设备的监管控:

  • 对设备进行实时硬件状态监控;
  • 巡检机房,发现设备故障;
  • 电话/邮件/微信/短信告警,
  • 向服务商报修;
  • 收集设备日志,定位设备故障;
  • 远程KVM登录设备管理设备;
  • 统计机房的空间、能耗数据;

 

设备服务年限到期下线:

  • 设备达到使用年限之后,对设备进行下线;
  • 对设备的空间、能耗以及备件等资源进行系统回收;
  • 设备报废后触发采购流程,完成闭环

 

广州云新信息技术有限公司自主开发的CloudSino DCM以数据中心硬件设备为核心,采用带外管理方式对设备进行全生命周期管理,从采购到安装使用,再到运维、报废的整个过程服务。可以有效帮助客户减少繁琐、重复、费时的各项运维工作。

 

  • 采购

当设备进入数据中心,首先通过CloudSino DCM进行业务流程审批,包含上架申请等过程。然后,CloudSino DCM对资产进行自动化的验收,主要检验配置是否符合规范,对各个选件(CPU/内存/硬盘等)做自动化的压力测试。可以实现选件级别的资产验证,所有信息都为自动更新采集。如内存信息,可以自动收集所有内存的插槽信息、容量、频率等。设备验收可以实现部件级设备验收:如内存,可以验收内存总容量,同时可以验证型号、容量和数量信息。当设备通过验收之后,可以通过网络自动化发现设备,可以自动化获取设备上带有的资产信息,并将设备自动化列入资产管理。

  • 上线

完成资产验收之后,客户可以从模板库当中,选择对应的自动化安装模板进行全自动化的安装。在该设备在设备状态列表中的状态将更新为已上线的可用状态。整个过程只有上架申请和模板库选择模板操作需要人为干预,其它过程均为标准化的自动化流程,可以大大提高部署效率,并减少人为操作带来的上线质量不合格问题。

  • 设备监管控

在设备上线之后,CloudSino DCM可以从资源、机房、业务、设备等多种不同的视图监控数据中心的各种资源。对于设备异常状态可以实现多途径的告警,包括邮件、短信、微信等形式。整个监控、分析都由CloudSino DCM后台自动化执行,无需要人为干预去处理部分设备故障。同时,CloudSino DCM对机房空间、能耗进行自动化的数据收集、统计。

CloudSino DCM提供所有服务器远程虚拟KVM功能,不占用系统资源和网络资源、不需要安装代理程序(Agent)。同时,可以节省大量购买物理KVM费用等设备的采购费用。通过CloudSino DCM的监控、告警功能,可以有效的替代对于小型机、X86服务器、存储设备、备份带库、光纤交换机等设备的人工机房巡检。这种方式大大节省了人工巡检所需的人力,也提高了巡检的效率。

  • 下线

设备到达使用年限之后,对设备进行下线处理。CloudSino DCM将其能耗、电力及部分可用部件资源在系统内进行分类回收,同时触发采购流程,形成闭环的全生命周期管理。

 

猜你喜欢

转载自blog.csdn.net/CloudSino/article/details/115231424