HPE脚本更新致京都大学77TB数据被删

不知道大家对1TB的磁盘能存储多少数据有没有概念,1TB等于2^40字节,如果我们在微信上发的每条消息定为10240字节大小,也就是10K,那么用一年的时间也就是3153.6万秒去积累1TB的数据,需要你每秒发送约3.41条消息,并且24小时不停才能够完成,所以1TB数据是非常多的。

77TB数据被删

在2021年12月29日,日本京都大学发布公告称,在2021年12月14日至16日间,自己在备份超级计算机系统的过程中,因慧与科技(HPE)推送更新的软件脚本失控被无意中抹去了77TB的研究数据。有14个研究小组的总计3400万个文件被删除,事后有近三分之一的研究小组无法找回他们的数据。京都大学将此次事故的发生完全归咎于HPE的超级计算机系统。

 图片来源京都大学情报部

注:慧与科技公司(HPE)前身为惠普的企业级部门,2015年11月从惠普公司中拆分成立。主要业务为大型企业以及中小型企业,提供针对云端及服务器等设备的服务,为用户提供电脑硬件制造与软件服务

HPE表示他们不知道更新的副作用

京都大学发布的一封HPE的道歉信中表示,HPE公司曾在事件发生前,对该超级计算机上使用的脚本进行了一次更新,其目的是为了在备份脚本中,利用一个查找命令删除超过10天未更新的日志文件。除了脚本的功能改进外,还改变了传递给查找命令的删除变量的名称,以提高文件可见性和可读性。然而,在这个修改后的脚本的发布程序中,HPE缺乏考虑,没有意识到这种行为的副作用,当备份系统还在运行时,就发布了更新后的脚本,还重写了一个bash脚本。这导致了在系统在运行过程中重新加载了一次修改过的shell脚本,造成了未定义的变量。

就是这样的一个软件更新的错误,导致Cray/HPE系统几乎删除了/LARGEO[备份磁盘存储]中存储时间自2021年12月3日17:32未更新过的所有文件,不只是删除预想中的日志文件。京都大学最初担心会有100TB的文件永久丢失,但结果比预想中的少很多。

HPE将承担全部责任?

慧与公司在2021年12月29日京都大学发布的一封信中说,它们将承担此次事故的所有责任,包括任何经济上以及其他方面的损失。但HPE的做法引起了一些日本Twitter用户的冷笑,他们觉得HPE能承担起85%或31.3%的责任就不错了,不可能全部承担。

 图片来源京都大学

京都大学是日本最重要的研究机构之一,在化学、免疫学、材料科学等方面的研究得到过全球相关人士的认可。截止目前还不清楚是哪四个部门永久地失去了他们的研究成果,这些研究曾浪费大量的人力,物力,财力,想要在短时间内回复这些研究成果将非常困难。

参考链接:Botched HPE software update deletes 77TB of supercomputer files

猜你喜欢

转载自blog.csdn.net/qq_43529978/article/details/122348059
77