企业上云,数据丢失能怎么办?三大教训不能忘!


8月5日晚上,《今日头条》刊发的一篇文章“腾讯云给一家创业公司带来的灾难!“吸引了众多人的注意。该文提出了一个严肃的问题:云计算时代,企业应用和数据完全上云后,如果数据丢失,找不到了,企业应该怎么办?


这是任何一个企业都不能回避的问题。当企业的数据全部上云,云计算提供商又保证有多重措施保护用户数据的安全。但是,当真正的灾难降临时,作为企业生命的全部数据找不回了,企业该怎么办?能怎么办?只能未雨绸缪,做事后诸葛亮!


640?wx_fmt=png


怎么回事?


“腾讯云给一家创业公司带来的灾难!“一文提到:北京清博数控科技有限公司所属“前沿数控”平台在使用腾讯云服务器8个月后,放在云服务器上的数据全部丢失,腾讯云所谓的三备份数据也全部离奇丢失!


随后的8月6日,腾讯云发布一个声明:关于用户“前沿数控”数据完整性受损及腾讯云补偿措施的说明。腾讯云用户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统云盘,因受所在物理硬盘固件版本bug导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。


腾讯云监控到异常后,第一时间向用户告知故障状态,并立即组织文件系统专家并联合厂商技术专家尝试修复数据。遗憾的是,虽经多方努力,最终仍有部分数据完整性校验失败。经过分析,该硬盘静默错误是在极小概率下被触发。我们随即对固件版本有bug的硬盘全部进行下线处理,确保相关隐患全部排除。


随后,腾讯云向“前沿数控”接口人伍先生说明情况并表达歉意,同时安排专人积极与接口人沟通,也在第一时间制定如下“赔偿+补偿”n方案,以期将用户损失降最低。

基本的事实就是腾讯云把用户的数据弄丢了,现在已经进入赔偿+补偿阶段,怎么补偿,不是本文关注的内容。


中断服务常见,数据丢失却异常罕见


随着企业上云进程的加剧,企业应用和数据完全上云越来越多。但是云服务商提供的服务却不能完全百分之百满足用户的需求。毋庸置疑,“永不掉线”是云服务商愿景的核心部分,100%的高可用性却成为难以保证的“奢求”。


目前。世界上大部分公有云服务商都出现过服务器宕机、服务中断的情况。而且原因也五花八门。如7月24日上午腾讯旗下云计算服务在广东地区宕机,腾讯云表示事故原因为合作运营商光缆中断。6月27日下午,阿里云出现故障,半小时内恢复正常。阿里对于故障的解释是,“系工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,但上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。”在2012年和2013年由于电力故障和雷击事件等原因连续发生宕机事件后,全球最大的云计算企业亚马逊也出现过云存储问题,除了造成服务响应延迟或中断之外,还可能造成数据的丢失,给用户带来巨大的经济损失。


对于企业用户来说,在享受云服务带来的便利的同时,也面临着云服务宕机带来的巨大挑战。云服务中端对用户而言最直接的损失就是说造成业务中端,对一些关键业务系统而言,业务中端的损失是巨大的。在过去的一年时间里,摩拜先后四次发生大范围的宕机事件,其中三次宕机全部出现在上班早高峰时期。频繁的在重要时间段出现故障,已经在不断降低自己的品牌形象和用户信任感。


但是因为云服务中断而造成用户数据全部丢失确实比较罕见。所以,企业需要根据自身的需求提前制定数据管理策略,并应用全面的数据管理解决方案,确保云中数据安全无虞。


事后诸葛亮!牢记三大教训


不但要保证数据安全,最重要的是防止数据丢失,在云计算时代对用户而言确实是一大挑战。建议用户层从三个层面来规划。


第一, 在企业上云的过程中,多云成为一个上佳策略。


多云被广泛认为是云计算的未来,多云本身就是不把鸡蛋放在一个篮子里。多云指的是在业务架构内使用多个云计算供应商和提供商(跨公共平台和专用平台),从而使组织能够根据其特定要求将不同的工作负载分散到不同的环境中。


混合云是公有云、私有云两种的任意混合,是目前最受推崇的一种多云方式,为企业提供两全其美的解决方案,将私有云的控制性与公共平台提供的业务敏捷性相结合。


面临的最大挑战是公有云+私有云的管理。在多云时代,IT 组织需要通过一个统一的实时视图来掌握所有私有云、公有云和分布式云的状况。据分析机构451 Research公司的调查研究,到2019年,69%的企业将运行混合IT环境。而根据调研机构Gartner公司预测,到2020年,90%的企业将采用混合基础设施管理功能。  


第二,多云战略下,公用云的选择要与时俱进。


公有云逐步走向成熟,并成为香饽饽后,各路大佬们一并涌了过来。粗略估计,目前对外提供公有云服务的平台和品牌,大大小小有上百家。目前依靠价格战已经很难吸引更多的用户,毕竟公有云越来越透明。


究竟选择哪种公有云?如何衡量公有云平台现有及未来的实力?这是一个大话题,很难回答。专家认为,如果从满足客户需求和价值创造角度出发,基本上可以划分为三层阶梯式的考量维度:一是能否满足业务需要 ; 二是总体拥有成本的高低 ; 三是能不能引领业务创新。


最起码的一点,互联网产品的技术架构讲究用户的承载力和伸缩性,有没有经过规模化验证,是评判公有云平台稳定性、可靠性、扩展性的重要指标。


另外。要考察云服务商是否有丰富、完整的生态体系的支持。企业级服务与消费市场一个区别就是特别强调生态的构建。产业链上的合作伙伴越多,越能形成合力,生态的势能才足够大,最终形成强势的竞争壁垒。如果一个云服务平台缺乏庞大生态的支持,也就很难满足客户业务的需求。


第三,在云环境下,也要考虑考虑容灾备份


目前,容灾备份已经成为一个信息系统的必备部分,这已经不是一个简单的技术问题,而是一个管理策略问题。但是没有容灾备份系统的信息系统的企业比例却非常高。


当用户的系统上云以后,要不要容灾备份,企业用户经常会更纠结,因为云服务商已经提供了非常好的容灾备份系统。事实说明,很多云计算服务商的容灾备份系统是聋子的耳朵样子货,用户应该依据业务需求和成本考虑,考虑建立自己的容灾备份系统。

作者简介


刘学习

前15年,专注于服务器、存储以及云计算

后5年,爱上基础软件、管理软件,以及国产化系统

冀望与企业一起成长,与产业一起发展!


微信:Fiyinghare

邮箱:[email protected]


640?wx_fmt=jpeg

点击【阅读原文】即可报名

2018中国软件生态大会 · 上海站

猜你喜欢

转载自blog.csdn.net/Z1Y492Vn3ZYD9et3B06/article/details/81517845
今日推荐