云计算存储之什么是Ceph?听听Ceph创始人怎么说

说起Ceph,可能更多的人还是通过OpenStack认识了它,但实际上,Ceph的诞生比OpenStack还要早上许多年。2004年,Sage Weil在加州大学Santa Cruz分校攻读博士期间,发明了Ceph,2006年,在著名的OSDI学术会议上,Sege发表了Ceph的论文,从此,Ceph才开始逐渐为人所知。随着OpenStack的迅速发展,Ceph搭上了OpenStack的春风,受到各大厂商的追捧,Intel、DreamHost、SanDisk、CISCO、Yahoo等公司都或多或少的参与其中。RedHat更是一掷千金,直接砸了1.75亿美金将Sage创建的Inktank公司及其Ceph团队收入囊中,将其作为IaaS三大组件计算、网络、存储之一,Ceph从此名震天下,Ceph更是成为OpenStack后端存储的唯一标配。


1. Ceph是什么?

那么,Ceph到底是什么?它凭什么可以成为OpenStack后端存储的标配?要谈论这个话题,恐怕没有人能够比Ceph项目的创始人Sege Weil先生更有资格了,而就在3月22日首次在中国举办的Cephalocon APAC 2018上,Sege Weil先生亲自来华,因此,老孙也有幸请Sege Weil先生自己来回答了这些问题。

“2004年我创立Ceph项目的时候,当时的初衷是为一个超算中心里面的超级计算机提供PB级存储方案,因此,Ceph实际上是一个高性能分布式文件系统,然后,随着OpenStack的出现,我发现这个项目能够为以OpenStack为核心的云计算提供存储基础设施,从而可以从仅仅为超算中心提供分布式文件系统扩展到为更多的数据中心提供存储基础设施的支持,因此,我们开始对Ceph进行针对云计算基础设施的改进和优化,Ceph设计之初仅针对对象存储,而云计算不仅需要对象存储还需要块存储和文件存储,所以这些年来,Ceph增加了对这些功能的全部支持,因此Ceph现在已经能够充分满足云计算数据中心的需求。”


2. 为什么是Ceph?

Ceph创立的初衷并非是为了OpenStack,但Ceph最终会成为OpenStack后端存储标配,首先当然是由于Ceph能够与OpenStack无缝的结合,但Ceph本身在技术上的创新也是Ceph能够取得成功的关键。

最关键的创新,是Ceph能够同时提供对象存储、块存储和文件系统存储三种存储服务的统一存储架构,因此能够满足不同应用需求前提下的简化部署和运维,这是Ceph被OpenStack用户热衷的最主要原因。

其次,是Crush算法。Crush算法是Ceph的两大创新之一,通过Crush算法的寻址操作,Ceph得以摒弃了传统的集中式存储元数据寻址方案。而Crush算法在一致性哈希基础上很好的考虑了容灾域的隔离,使得Ceph能够实现各类负载的副本放置规则,例如跨机房、机架感知等。同时,Crush算法有相当强大的扩展性,理论上可以支持数千个存储节点,这为Ceph在大规模云环境中的应用提供了先天的便利。

第三,Ceph中的数据副本数量可以由管理员自行定义,并可以通过Crush算法指定副本的物理存储位置以分隔故障域,支持数据强一致性的特性也使Ceph具有了高可靠性,可以忍受多种故障场景并自动尝试并行修复。而Ceph本身没有主控节点,扩展起来比较容易,并且理论上,它的性能会随着磁盘数量的增加而线性增长,这又使得Ceph具备了云计算所应该拥有的高扩展性。因此,Ceph能够获得OpenStack用户的青睐也就不足为奇了。


3. Ceph的未来怎么样?

虽然Ceph有很多优点,也被OpenStack所推崇,但Ceph并非是尽善尽美,Sege也很大方的承认了这一点,他认为,Ceph在性能、易用和节能方面还有很大的提升空间,同时,Ceph在数据去重、压缩、同步、异步等企业级功能方面也有所欠缺

红帽首席方案架构师张家驹则表示,Ceph来自于社区,Ceph社区的繁荣是毋庸置疑的,但从另外一方面讲,社区是比较松散的结构,因此社区版的Ceph在产品的功能性,企业级特性方面都会有所欠缺,而解决这一问题的最有效途径就是由专业的厂商,对社区版Ceph进行产品化,做出一个稳定的企业级产品。同时,专业厂商对Ceph产品的改进和优化也会回馈给社区版产品,从而保证Ceph能够持续不断的向前发展。

在谈到Ceph的未来会不会成为今天的OpenStack时,张家驹认为,“OpenStack和Ceph是一起成长起来的,没有Ceph,OpenStack可能也不会这么火,OpenStack更多是在控制面,Ceph关注的则是数据面,这是两个方向的发展,控制面技术发展到今天可能出现了一些演化的趋势,比如出现了一些容器和其他的一些东西,但是OpenStack和Ceph有各自不同的应用场景,作为红帽来看,我们发现控制面有逐渐演化的趋势,但是数据面看到的只有Ceph,我们一开始从计算领域到云到对接容器,是逐渐演化成熟的过程,所以至少在目前我们并没有看到分布式存储的领域里有可以替代Ceph的技术,未来是会变化的,而作为Ceph来讲,我们会不断的适应新变化,对接新的软件堆栈,不断的适应新的应用场景,包括不断的对应新型的硬件,而当硬件发生变化的时候,软件之前的性能瓶颈就能够自然而然的克服,我觉得Ceph目前在开源存储领域是一个非常火爆并且非常团结的社区,所以会有众多厂商积极参与Ceph社区的建设。我们相信Ceph的明天会更美好,而且应该是比OpenStack的发展还要更美好!”


作者:孙浩峰
原文:https://blog.csdn.net/sunhf_csdn/article/details/79797186

猜你喜欢

转载自blog.csdn.net/baidu_34122324/article/details/84527695