大型分布式系统更容易总体宕机?

今天在微博上(http://e.weibo.com/1919897211/A5MFWtQ8S)参与讨论【分布式为何解决不了宕机问题?】,说到了我以往提出的一些观点,被“求链接”,结果愣住了。想来也是,我一贯不把日常工作中的东西发出来的做法,减少了很多沟通机会。虽说当时立刻发可能不太合适,但过了两年了,随便找个八点二十发一下应该问题不大,更何况可以裁减,把敏感信息都删除就行了。

当时是给某银行讲一下借鉴云计算模式进行运维管理的思路,首先强调的就是不能完全借鉴大规模公有云当中普遍采用的高度自动化的模式,否则容易导致更严重的问题。这就是PPT的第一部分,后面几部分就是商业活动了,也没什么太多可讨论的,正好删除掉。与上面那个话题有关系的,主要就是关于公有云著名停机事件的说明以及后面一页,当时所讲的内容,自然没有录音,大意基本上就是在上面那个微博中所说的内容,两个配合起来看基本上就全面了,不在这里重复摘录了。

猜你喜欢

转载自edge.iteye.com/blog/1928413