智和网管平台(SugarNMS)油气管线网管系统解决方案

一、油气管线网络设备系统管理现状

  随着油气管线的铺设,管线监控的信息化程度越来越高,信息化所依赖的基础网络也显得越来越重要。在这些基础网络里面运行着最重要的网络设备、服务器以及服务器上运行着重要的业务系统、数据库。大量的网络设备对其管线自动化系统数据传输进行保驾护航,然而在建立SCADA自动化系统过程中,这些大量的网络设备本身以及SCADA系统的设备本身一直没有一套完整的网络监管系统对其进行统一管理。

油线管线线路长,跨度大,这造成了网络设备比较分散,距离远,种类繁杂的现状。如果基础网络或者服务器发生严重故障,将影响到业务系统的正常服务,业务也将受到严重影响。在故障发生后,也不能及时定位和排除故障,带来的影响将变得更加巨大,甚至是无法挽回的损失。

二、油气管线网管系统整体需求

  实现对中心及所有站场的网络设备(交换机、路由器、交换机、中间件、服务器、工作站等)进行远维管理,网络设备远维数据通过安装在中心的网管软件进行采集并将数据存储在中心网管服务器中。在中心实现对中心及各站场网络设备的远程管理,具备全景拓扑、网络设备监控、服务器主机操作系统监控、服务器主机硬件监控、存储监控、虚拟化监控等功能。

要满足对网络环境整体监控的需求,必须满足下面几个条件:
  •  系统可靠性要非常高,可以7 X 24小时稳定运行;
  •  实施必须简单,并且要求易用性好,操作简单;
  •  必须图形化自动搜索并展现整体系统拓扑结构;
  •  根据整体系统的网络规模,能满足大规模监控的高性能要求;
  •  同时支持对网络内各种防火墙、交换机和路由器设备进行监控,包括设备的CPU使用率、RAM使用率和各接口流量、错误包等,通过对设备运行状态的监控,提前获取设备异常的报警,避免故障的发生;
  •  对出口线路的可用性、线路质量(丢包率、延时)进行监控,提供出口流量情况的详细流量曲线及报表,为上网线路及带宽的选择提供依据;
  •  同时支持对Windows和Linux、unix等操作系统的系统资源(CPU使用率、RAM使用率和磁盘空间等)进行监控,通过对服务器运行状态的监控,提前获取服务器异常的报警,避免故障的发生;
  •  对服务器上运行的各类数据库系统进行监控;
  •  统一收集储存网络设备和服务器上产生的日志,并可设定关键字实现报警;
  •  能通过手机短信、电子邮件和监控终端屏幕、蜂鸣器等进行报警;
  •  提供安全可靠的手段让授权的管理人员能通过互联网在任何地点,任何时间对进行远程管理;
  •  对于大型整体系统,可实现分布式部署,各分支的监控和报警信息能集中到总部中心主系统中。

三、油气管线网管系统解决方案

  智和网管平台SugarNMS专注于局域网、广域网网络环境中的网络设备、主机/服务器、数据库、中间件、Web服务的实时监控,SugarNMS采用高度弹性的架构设计,支持SNMP、WMI、Telnet/SSH、JDBC/ODBC、JMX、TCP/IP等多种管理协议,最大程度的企业客户对网络软件的需求。

智和网管平台是智能化的网管软件,包含网络拓扑管理、网络设备管理、 设备配置管理、故障和工作状态管理、性能管理、报表统计、多用户安全管理等功能。

  1. 通过网络自动搜索,自动发现网络设备,自动发现设备类型,自动发现设备间的链接关系;
  2. 自动发现设备上的网络接口、设备板卡、线路、链路、处理器、内存、磁盘、数据库服务、中间件应用、软件服务等设备资源信息;
  3. 通过智能化的拓扑图操作界面实时直观的组织和呈现被管网络、设备和设备资源;
  4. 软件通过智能化的故障监控策略定义、性能采集策略定义,可以实现对任何SNMP、WMI、Telnet/SSH、ODBC/JDBC、JMX设备和应用的监控;
  5. 管理网络设备的端口、带宽、吞吐量、流量、丢包率、错误包、运行状况等;
  6. 管理Windows、Linux、Unix服务器的运行状态、CPU、内存、磁盘、进程等;
  7. 监视各种数据库、中间件、Web服务器、邮件服务器、J2EE服务器、应用系统等;
  8. 通过邮件、短信、状态灯、界面提示等方式对故障、状态、消息进行分发;
  9. 深入了解设备及服务器的配置信息、运行信息、性能图表、故障图表等。

四、智和网管平台SugarNMS油气管线方案特色

4.1一键式智能网管

  用户只需输入IP范围,智和网管平台SugarNMS通过一气呵成的方式自动完成以下操作:采取多种物理链接算法自动发现油气管线中的卫星设备、光传输设备、网络设备、设备厂商型号、探测设备资源、发现设备链路关系,生成设备面板图、自动运行监视任务,自动设备性能数据,自动将监控结果呈现给用户。真正达到一键式操作就可轻松管理整个网络。

 

4.2智能化发现设备链路关系

支持独有的设备发现协议,能智能化发现网络设备间的链路关系,通过图形化的拓扑方式展现在拓扑视图,包含交换机、路由器、主机间的链路关系。

 

4.3综合全面的网管管理

SugarNMS油气管线网管为一套综合性网管,可同时管理卫星设备、光传输设备、商用网络设备、服务器。避免整体系统在同一网络中部署多套网管软件。

4.4设备和故障扩展功能

对于新的设备类型、未知设备种类,如项目加入新类型油气管线设备,此时用户无需开发编程,利用系统提供的GUI策略扩展界面,就可以完成对新的设备支持。系统提供了:设备类型、面板图模块、设备资源、故障监控指标、性能监控指标、TRAP策略的扩展策略。

 

五、油气管线网管解决方案实施

5.1全景拓扑

全景拓扑图将业务视图、网络视图、应用视图、虚拟化视图和存储视图融合在一起,完整展现统一的IT架构,实时掌握整体IT环境的运行状态,并且通过线路和设备的颜色、指标可以清楚的看到整个IT环境的变化。

5.2网络设备监控

智和网管平台SugarNMS可以主动从多个方面监控网络设备,能实时监控设备网口、电口、光接口的状态。包括端口可用性、端口性能数据、端口故障、链路问题都能通过网管软件实时掌控。当网络中的结构发生变化时,能够迅速的发现并及时调整网络的拓扑结构图。

软件能直接在操作界面真实展现设备的机架图、面板图,并能方便的配置和自定义机架图和面板图。软件中可按照区域的粒度划分管理网络,在每个网络中均以拓扑的方式呈现该子网所有设备的实时状态。在每个子网之间也可建立彼此的链接关系。

5.3服务器主机操作系统监控

智和网管平台SugarNMS可以自动发现网络下的主机/服务器,也支持手工添加和删除主机/服务器。软件能主动监控主机/服务器的在线状态,对主机/服务器资源如:CPU、磁盘、内存、网络接口、系统进程等进行性能采集。并可以设定监视器指标对资源进行实时监控。

5.4服务器主机硬件监控

智和网管平台SugarNMS通过设备中间层接入其他设备类型,平台封装IPMI和iLO2接口,使用中间层接口实现对服务器主机硬件设备的温度、电压、风扇工作状态、电源状态等进行监控,同时对HP服务器进行开关机,重启、服务器状态的监控、虚拟KVM等监控。

5.5存储监控

智和网管平台支持用户自定义设备类型及其设备资源。具有设备模板的功能,允许用户自定义设备面板图,最大可能的支持对不同设备类型的支持。通过自定义设备类型及其设备资源,最大限度上提高了智和网管平台的管理范围,真正实现了对设备及其资源的全面化管理,达到管控万物的目标。

同时,SNMP协议为标准的网管协议。可以完全通过功能扩展完成HP存储系统、IBM存储系统、SUN存储系统、EMC存储系统、Isilon存储系统、Apusic ESB、昆腾磁带库等SNMP协议监控的设备无缝接入。

 

5.6虚拟化监控

自动发现网络中虚拟服务器,包括虚拟机服务器和虚拟机工作站。如:vmWare esxi、citrix xenServer、MS windows Server 2008 Hyper-V等等。并能监控虚拟机载体和其资源池的各种性能指标,如CPU负载、内存使用率等性能

5.6.1虚拟化机监控可以分为两种视图进行监控

虚拟机服务器作为一个实体进行监控,虚拟的操作系统作为实体的内部资源。虚拟的操作系统作为实体监控,监控策略和5.3章节服务器主机操作系统监控一致。

5.6.2VMware 高可用性功能(HA)

软件通过VMware主机提供的HA接口,完成相应的HA功能设置。保持集群服务的高度可用性。

5.6.3分布式资源调度(DRS)

软件通过VMware主机提供的DRS接口,完成相应的DRS功能设置。使集群达到资源的合理迁移。

5.6.4操作记录查询

用户的所有操作都会记录到操作日志中,可以按照相应条件查询操作日志并以”Excel文件”导出。

5.6.5告警策略

智和网管平台提供告警策略接口,以完成告警支持条件和状态触发,并可使用运算符集合,例如CPU利用率大于95%持续10分 钟以上,并且内存占用率大于90%持续5分钟才产生告警。

5.6.6告警联动

智和网管平台提供告警联动接口,以完成告警产生后续操作。通过电子邮件、SNMP、执行命令、使主机进入或退出维护模式、使主机进入或退出待机、重新引导或关闭主机、挂起虚拟机、启动或关闭虚拟机、重置虚拟机、迁移虚拟机等操作。

5.7数据库系统监控

智和网管平台通过JDBC/ODBC对数据库进行监控,不采用任何代理,监控数据库的表空间使用率、剩余表空间大小、CPU占用时间、内存使用率、锁的数量、缓存命中率、客户端连接数、事务提交数 事务回滚数、数据文件、日志文件、后台进程信息等指标。同时管理员可以通过SugarNMS的扩展功能界面自定义配置数据库监控指标,实现更丰富的数据库指标监控。

5.8报表统计分析管理

SugarNMS网管具有强大的报表管理功能,能够生成实时的和基于天、星期、月及任意起止时间段的历史报表,报表包括实时性能/故障报表、性能/故障趋势报表、性能/故障统计报表、TOP N 报表等多种类型,以及曲线图、柱状图、面积图、饼图、正负图等多种表现形式。对于统计的图表均支持导出和打印功能以便备份和对比查看。

 

此外,系统还提供可配置的报表模板对设备、故障、性能数据自动生成不同监测组合的实时、日报、周报、月报、年报。

SugarNMS采用iReport开源报表工具,用户可以自定义报表模板,来适应不同需求的报表。

 

5.9故障和事件报警

软件主动轮询网络设备的在线状态。当设备的流量超标、功率过大、CPU负载、内存负载、温度过高等都可以产生告警。同时设备主动发出的trap和Syslog等告警信息软件也可接受。

 故障采集:SugarNMS 具备主动的故障监控功能,能从众多的事件和状态中,系统将零散的状态信息,总结成为当前工作状态,并产生告警。

 故障优化:包括事件过滤机制、故障事件上报机制、故障事件呈现过滤、故障事件入库过滤、故障事件确认等处理机制,有效避免误报和漏报。

 故障通知:故障可以通过界面颜色、告警列表、声音、短信、Email等方式发出通知,告警可以向上逐步追溯,按照从全局—>网络—>设备—>设备资源的管理习惯来组织故障显示。

 故障定位:可实现快速的故障定位,能一步定位到发生故障的源头设备,及时处理好故障,有效地预防故障发生。

 故障处理:通过故障阀门值的设置,可以在故障真正到来之前,提前触发通知机制。并支持三级逐步预警。在故障消失后,系统能自动检测到先前故障,并做自动清除告警处理。

5.10数据接口

智和网管平台已经集成Hessian、WebService、Cobar、JDBC等对外接口。SugarNMS使用设备中间层隔离了数据采集和业务逻辑,这使得平台能够扩展其他对外接口,如OPC、OLEDB等。

5.11 SugarNMS实施效果

通过实施SugarNMS综合解决方案:

  • 全面监控管理网络中软硬件设备和业务系统,对IT资产进行全生命周期管理。
  • 改变运维方式,实现故障预警,变被动响应为主动维护。
  • 提高运维效率,变手工维护为工具自动运维,业务中断次数减少,中断时间大幅缩短。
  • 运维工作流程化规范化,运维工作可跟踪、可统计,IT运维管理水平大幅提高。
  • IT资产清晰,延长系统使用周期,降低企业IT支出成本。
  • 降低了运行成本和业务风险。

猜你喜欢

转载自market201609194918.iteye.com/blog/2345300