智慧的数据中心运维风险管理

什么是智慧?《辞海》上解释为“对事物能认识、辨析、判断处理和发明创造的能力。作为世界上最成功的高科技企业之一和创造新概念的高手,IBM公司在2009年伊始提出了智慧地球的概念,以期给地球上每一个看似无序的“物件”全部嵌上智能的“大脑”和“心脏”,以一种“更智慧”的方法来改进政府、公司和人们相互交互的方式,以便提高交互的明确性、效率、灵活性和响应速度。各行各业的系统都需要变得更智慧,只有这些系统都演变成智慧系统,智慧地球才能真正实现。
近五年来,国内数据中心建设的投资年增长率超过20%,各大行业都在规划、建设和改造各自的数据中心。然而,随着信息化发展的不断深入和信息量的爆炸式增长,数据中心正面临着前所未有的挑战。
根据数据中心性能研究机构Uptime Institute所提供的数据,目前人为失误引发了大约70%的数据中心故障。因此,需要最大程度地减少人为操作的风险。据统计,仅2011年至2012年期间,因数据中心内部IT运维人员的误操作或越权访问,给数据中心管理者所带来的损失就高达数百亿元。
从这些数据中可以看到,如何保障数据中心IT基础设施运维管理的可靠和安全,已经成为数据中心运营管理者最为关注也最棘手的问题。
目前,数据中心运维普遍存在数据量急速膨胀,运营成本高昂、安全性差,业务连续能力低等一系列挑战,例如:
各种服务器上各种各样的帐号和密码种类繁多,管理复杂;管理员、设备供应商人员、第三方代维人员较多,究竟谁动了配置和数据不可定位、追溯;各种误操作、违规操作、恶意操作可能导致系统问题或信息被篡改、破坏、泄漏;用户通过远程接入进行操作存在严重隐患;对操作行为无法监控和审计。
目前数据中心亟待解决的问题主要有:如何降低运维操作导致的安全风险;如何降低运维操作成本,从复杂繁重的维护升级和大量的后续资金投入中解脱出来;如何保障数据中心运维管理合规性。
数据中心运维安全审计系统可以缓解上述问题,然而解决运维操作风险问题难度大、涉及面多(人员、设备、资源、应用、账户、操作等),技术面广且难点多,难以有效统一管控。如果产品设计和实现不到位,容易造成管理复杂且使用不便,难以适应数据中心实际环境和发展需要。目前部分运维堡垒机厂商的产品普遍存在以下问题:
(1) 运维堡垒机的账户系统未能与设备系统账户完全分离。运维堡垒机要求所有应用访问均通过代理机制完成,而不应有“落地”行为。然而,有些厂商号称是运维堡垒机,但仍然遗留了很多跳板机的设计,即运维操作用户名都建立在系统上,而不是独立的数据库,这种情况下就无法建立“root”名的运维用户名。
(2) 运维堡垒机成为了新的系统脆弱点。由于运维堡垒机是连接前后端的唯一途径,首当其冲成为了被attack的重要目标,风险加大。因此应该尽量减少系统加载的服务或模块,从而尽可能减少可被attack的风险。
(3) 部署困难,管理繁琐,用户操作体验不佳。特别是在管理设备种类较多、设备数量规模较大的情况下,存在配置界面复杂,操作方式不连贯,部署费工费时等问题。
北京尚思卓越创新地提出了智慧的运维操作风险管理这一产品理念,推出了尚思卓越操作风险管理系统,能够全面满足管理者对数据中心运维安全管控的迫切需求。
北京尚思卓越的研发团队认为,如果能够经由一种更智慧的方法来改变运维人员和IT基础设施交互的方式,显著提高交互的安全性、合规性、效率、灵活性和响应速度,既能很好地解决运维操作风险,又能便捷支持各类运维终端应用,部署简单使用方便,管理者将会从复杂的运维管理中解脱出来,而专注于提升数据中心的核心价值。
为了研发出一款智慧的产品,在设计之初,北京尚思卓越就采取了以下方面的努力,确保尚思卓越操作风险管理系统成为一款革新性的产品。
感知需求:北京尚思卓越拥有出色的研发团队,根据多年的IT内控和堡垒机产品研发经验,深入感知用户需求,在传统的运维操作风险管理的核心要求(身份管理、访问控制、操作追踪、合规报表)之外,准确定位堡垒机作为系统中单一故障点的高安全性、高可用性和高可靠性需求;
创新技术:通过在系统体系架构、智能功能和安全保障等个方面的变革创新来满足用户需求,并前瞻考虑,进一步地满足用户2-3年内的增长性需求,超出用户期望。
北京尚思卓越智慧的运维风险管理的核心是通过尚思卓越风险管理系统,使风险管理设备与IT基础设施的完美结合,运维人员可以进行更高效的操作,做出更明智的决策,降低运维操作风险,提高信息系统运行的安全性和事件的追溯能力,提高企业工作效率。
尚思产品提供的智慧的运维风险管理主要体现在以下四个方面:
(1)更透彻的感知
更透彻的感知是指尚思卓越操作风险管理系统可以时刻测量、捕获、监控和传递运维操作信息,基于专用硬件设备和裁剪定制的操作系统,通过使用先进创新的感知手段,快速获取运维操作信息并进行分析,便于立即采取应对措施和进行事后追溯。支持对所有主流运维协议的监控,包括文本类、文件类、图形类、Web类、数据库类和应用类等多种协议(如SSH、TELNET、RDP、VNC、X11、(S)FTP、HTTP(S)、ORACLE、InforMix、DB2、MSSQL、Sybase、MYSQL)的监控。支持多类设备和系统,包括主机服务器、网络设备、安全设备及数据库系统等,支持IBM Aix、HP Unix、Sun Solaris、SCO Unix、Linux、Windows等各种操作系统主机和各种网络、安全设备;支持Win XP、Vista、Win7、Win8等主流运维终端系统;支持Windows下所有主流浏览器,IE(内核)、Firefox、Chrome、Opera等。具有业界最强的协议转发处理能力,摒弃业界常用的协议转发“黑盒子”,能够对Telnet、FTP、SSH、SFTP、RDP(Windows Terminal)、Xwindows、VNC、AS400、HTTP、HTTPS协议进行完整的透明转发,特别是对图形化操作协议的转发性能远远优于其它同类型产品(最大并发数为500),并具有横向无缝扩展能力。自动获取管理的数据中心的设备账户和设备信息,方便管理员了解数据中心IT设备状况并及时进行更新和操作。
(2) 更全面的可见性
更全面的可见性是指通过运维堡垒机,使得管理者能更方便的了解当前的运维情况,更好地对运维操作状况进行实时监控,从全局的角度分析风险并实时审计,从而帮助管理者完成安全可控的IT运维。尚思卓越操作风险管理系统提供基于数据包的协议分析、还原虚拟化技术可以实现操作界面模拟,将所有的操作转换为图形化界面予以展现,实现100%审计信息不丢失。尚思卓越操作风险管理系统提供多种类型操作信息回放展现,除针对运维操作图形化审计功能的展现外,同时还能对字符进行分析,包括命令行操作的命令以及回显信息和非字符型操作时键盘、鼠标的敲击信息。使用更贴切、操作更易用,支持常规终端应用自适应关联,支持常规终端应用显示真实目标IP地址,注重细节上的用户体验。报表全视角模型展现,提供图形、表格等各类可视化展现方式,支持定期发送自定义报表,为用户提供全面的运维审计和合规性管理视图。
(3) 更深入的智能
更深入的智能是指深入分析收集到的数据,以获取细粒度、精确的运维审计信息,更加系统、全面的提供IT操作风险控制、内控安全和合规性等方面的完善、有效的审计手段。目前通用的审计工具大多从网络层面或服务器日志层面获取较为庞杂的信息,往往会导致关键的管理信息或敏感操作湮没于日常业务数据中,或无法追溯操作行为轨迹、了解操作行为意图,影响审计的有效性或效率。提供全面的操作追踪服务,再现关键行为轨迹,探索操作意图,支持全局实时监控与敏感过程回放。首创设备组内资源的扫描机制,便于智能化管理后端众多资源。这样在设备组设定好设备范围后,资源自动扫描将极大地减少设备的前期部署与后期管理成本,能够充分满足现有或未来设备数量较多的场景。简洁易用的人机交互,重视细节体验,采用符合用户线性化操作习惯的界面交互设计、符合用户层次化思维的设备管理界面设计以及支持用户关键字全列表视图模糊查询设计等人性化的交互设计,降低产品上线后的使用和操作成本。业界唯一采用非结构化数据库的堡垒机产品,采用为堡垒机数据特征量身定制的灵活高效NoSQL数据库,具有复杂度低、扩展性好、吞吐率高等特点,在灵活,定制、升级和迁移过程中不需更改库表结构,升级、定制成本低,极大提高了产品的扩展性和可维护性。
(4) 更可靠的安全
更可靠的安全是指通过对当前的安全实践进行评估并将其与业务需求和经营目标统一起来,实现运维操作管理和产品本身的安全。尚思卓越操作风险管理系统提供高效的身份和访问控制管理,随着 IT 基础架构的互联化和向云计算迁移,控制和监控用户的访问特权与活动变得越来越关键,也越来越复杂。尚思卓越运维风险管理解决方案可帮助企业减轻来自未授权访问的风险,支持有效的身份和访问控制管理。提供口令托管和改密功能,能够在增强安全性的同时,简化对运维口令的管理。强大的抗attack性,采用口令防嗅探机制,在系统认证层面,通过强加密方式传输主从帐号口令,避免可能的嗅探attack行为,在运维操作层面,采用动态口令,基于OTP (one-time password) 认证方式加密整个运维过程,保障运维安全。完备的高可用性,支持双机热备中设备间配置实时同步和操作日志零延时同步,支持独立心跳线和独立数据线,支持浮动IP、支持查看同步状态,全方位保障堡垒机的高可用性。完善的数据安全策略,采用业界首创的不落地操作日志网络回放技术,确保数据隔离,对系统内敏感信息、数据加密存储,采用完备的口令管理,并支持密函打印。完备的自身安全性保障,尚思卓越操作风险管理系统采用专门设计的安全、可靠、高效的硬件平台以及裁剪定制的Linux内核,不开放3389、21、22、23等高危端口,并支持身份认证口令尝试死锁,有效降低安全隐患。
北京尚思卓越推出了智慧的运维操作风险管理解决方案——尚思卓越运维操作风险管理系统,通过全新的方式连接运维人员与数据中心IT基础设施,帮助运维人员实现更透彻的感知、更全面的可见、更深入的智能和更可靠的安全,可以有效提高数据中心重要信息基础架构的安全级别,辅助对信息安全故障和安全事件的全面记录和事后追溯定位,能够有效帮助数据中心管理者降低运维使用成本,提高信息系统运行的安全性和事件的追溯能力,为管理者提供智慧的数据中心运维风险管理能力。

猜你喜欢

转载自blog.csdn.net/weixin_43738768/article/details/84823720