【云计算】从Serverless说起，谈谈边缘计算的未来；从物理机到Kubernetes的那些坑与心得

作者介绍

黄文俊，腾讯云高级产品经理。曾经理过企业级存储、企业级容器平台等产品的架构与开发，对容器、微服务、无服务器、DevOps等都有浓厚兴趣。

本文整理自1月20日DBAplus社群&腾讯云联合主办的“微服务架构交流会”。

Serverless是一个比较新的概念，2017年开始在行业内兴起，边缘计算则是一个更新的技术。那么Serverless在边缘计算中能产生怎样的效果、产品以及形态？今天来为大家分享一下。

什么是Serverless？

首先讲讲Serverless，从下面这张图可清晰地看到，Serverless从架构上可以分成两部分。

一是Backend as a Service，后端即服务，腾讯云上目前已经提供很多这类产品，例如COS对象存储、CMQ消息队列、CDN内容分发、CDB云数据库、API网关，这些产品更多的是承载数据的存储。

二是Function as a Service，函数即服务，也是Serverless比较核心的技术点，腾讯云云函数就属于这种。

从Serverless或者云函数来看，更多是对用户的计算进行托管。用户将代码和配置提交到云函数平台上，此处的代码是指用户的一份代码或者代码包、配置，一个是指本身对于函数运行环境的配置，使用的是哪种环境、所需的内存、超时时间等；另一个是触发器的配置。因为整个函数即服务的运行方式是触发式运行，触发就需要有一个事件来源，而事件来源是和我们其它产品进行关联后而产生。

例如COS对象存储产品，它的关联就在COS的存储桶中，当用户上传一张图片或者删除一张图片时，就会产生一个事件，这个事件会触发云函数的运行；例如和API网关的对接，也可以作为事件来源，在用户的HTTP请求到达网关之后，API网关会把该请求作为事件转发给云函数，触发云函数的运行，云函数拿到请求之后进行处理，生成响应给到用户。

函数计算的特点

上图左侧是代码和配置提交到云函数平台进行保存，真正事件产生后，针对每一个事件都会拉起一个函数实例，实现触发式运行；当真正事件来临时，用户函数才会运行，用户代码运行时才有云函数代码的数据运算和费用计算。

因为函数本身是托管型的，用户本身无法感知到实例在哪里运行。云函数平台背后有个大的计算资源池，用户实例触发之后，我们会从资源池中随机选取可运行的位置，把用户的函数实例在对应位置上跑起来。因此整个调度过程或事件来临之后的函数扩缩容过程，都是由平台进行的。对用户来说，调度的粒度更细了，而且调度也都托管给平台了。

而从整个计算过程来说，为什么会有这种产品的出现？对于传统的数据存储过程来说，数据产生后，更多会先把数据进行缓存或者存储，如以对象存储文件的形式保存，或在数据库中以结构化形式存储下来，再进行分析应用。有了函数服务产品后，我们可以有一个很大的加速，可以在事件产生时就立刻对数据进行处理，因此就变成了先处理，再对结果进行保存使用的过程。

计算靠近数据

那么，还能不能缩短中间数据产生到数据处理的传递过程呢？

对于传统应用来说，数据在用户那里产生，传到云上进行处理，再进行相应的存储。这里说的缩短距离实际是把处理过程更加靠近用户，靠近用户就可以认为是边缘计算的过程。并且这里的靠近用户指的并不是加速网络速度，而是更多把计算下发，放到更靠近用户的位置。

边缘计算

之前无论使用容器或主机，运算能力都是在云上提供，而边缘计算要做的事情是把运算能力下发到云之外去。

边缘计算的理念，就是把计算能力下发更靠近真正的用户，更加靠近设备这一端。

为什么会有这种需求的产生？

随着互联网以及物联网的迅速发展，接入的用户越来越多，设备也越来越多，在这种情况下，产生的数据量也越来越多。无论是个人用户，还是物联网接入设备，每时每刻都在产生大量的数据。数据不断增多的情况下，也同时要求我们对于用户的响应、设备响应越来越快，本身设备的计算能力也要越来越强。

10年前的一台PC都比不上现在一台智能手机的处理能力，设备的计算能力在越来越强的情况下，实现了把计算能力下发到更加边缘的位置的能力。

云函数目前在做的探索，可从两方面出发。

一是物联网方向，物联网主要是和设备打交道，实现设备上的边缘计算；从云函数本身的特点来讲，它属于触发型运算，真正数据产生之后才会拉起运算。云函数交由平台托管的调度，可以把云函数调度到用户设备上去。

二是把云函数调度到CDN的节点上去，虽然CDN可以认为是云的一部分，但CDN本身已经很靠近用户，CDN节点实际上已经在云的边缘。

IOT探索

接下来给大家做一个和物联网相关的效果演示。

先简单介绍一下几款设备，第一个是树莓派，熟悉物联网的同学一般都了解；第二个是光感的传感器，可以感测环境光，从中读取到环境光的流明值；第三个是LED灯。

目前这个设备已经跑起来了，它所做的事情是当环境光足够亮的情况下，LED灯就会暗掉，当环境光足够暗的情况下，LED灯会亮起来。从演示过程可看到，当我把光感器遮盖时，LED灯有一个亮起来的动作。目前的环境光和背景足够亮，当我打开时，因为光足够亮，所以LED灯会灭掉。

针对刚刚演示过程中的代码，我给大家做一个解释。首先可以看到目前在树莓派上跑的一段函数，已经下到树莓派上跑了，在网上看到的是线上的代码。接下来我会对代码进行修改，从代码中大家可以看到，当从传感器中读出的流明值足够大时，GPIO做拉高或者拉低的动作，目前是正常的表现。

刚刚我完成了一个修改，现在我要把代码下发到仪器上运行，同时把这里拉起，查看数值是否正确。下面不断刷新的就是传感器出来的流明值，目前传感器已经变化了，因为大家可以看到这个数值已经超过了200，LED灯是亮着的，当我把感光器遮盖以后，LED灯变暗，这是通过代码把行为做了反转的变化。

我们在目前的调试过程中也会做实际的设备调试，这里演示的就是真正把云函数下放到物理设备上进行执行的效果。

AI能力

接下来讲的是目前腾讯云函数和用户协同推进的AI能力，用户数据只要在腾讯云上利用CVM、GPU服务器、腾讯TML机器学习，进行AI训练，得出相应的训练后模型，再把模型和外围的导入代码进行打包，放入云函数或者是带有GPU的云函数，就可以对外提供AI的推理能力。用户真正使用AI时，从外面送过来一段用户需要推理的语音、文本或图像，在云函数中拉起训练模型，就可以对这段数据进行推理。

AI能力表面上看起来和边缘计算没有关系，其实不然。如果本身已经在物联网的边缘设计上具有了云函数的执行能力，那么是不是可以进一步考虑把AI能力下发到设备上去的，比如我们在云中进行数据的收集和训练，生成模型之后，利用模型更新云上的函数，然后可以利用一键下发把这种能力下发到设备中，使设备具备更强的AI能力。

通过这种方式可以让更多的设备接入AI能力，比如让家里的摄象头直接识别人脸，认识你的家人，或者让更多的医疗设备直接对医疗检查结果做出判断，识别疾病类型等。这些都将会是后期持续和各个物联网厂商进行摸索，往前推进的过程。

边缘AI能力

另外一个角度来说，我们为什么做CDN的边缘计算？CDN本身是把数据放到边缘去的一个过程，而边缘计算是为了把计算放到边缘去。为了更快地响应用户的操作需求，对于边缘传上来的数据进行更快地处理，这也是云函数对于边缘的探索。

对于边缘计算来说，云函数要做到的就是用户在云中能完成函数的编写、管理，在所需的位置把云函数下放各个位置运行和使用。

云函数未来在边缘计算中还会有大量的探索机会，CDN厂商、物联网厂商、硬件厂商等都将会有持续不断的合作发展，去探索尝试将边缘的物联网能力、边缘的AI能力、边缘CDN能力落地。

Q&A

问：腾讯云Serverless可以自己部署吗？

答：自己部署有分两种，一种是把云函数部署到设备上的能力，一种是Agent的部署。Agent本身是需要用户自行部署到用户自有的设备上去的。而今天演示用的是树莓派，Agent不局限于树莓派，它可以在更强的服务器中运行，比如可以用到设备的GPU、设备的存储、文件等进行分析计算。

问：我们想在自己内部部署一个类似的Serverless，腾讯云可以支持吗？

答：您说的是私有化部署，云函数本身没有考虑，我们云函数管理整体是在云上的，边缘计算提供更多的是边缘的调度和计算能力，函数在云上配置后，调度到设备上运行，云函数本身对于设备上的数据读取全部由自己控制，读取不用走网络，因为执行的代码包已经下发到设备上去了，体现的是让计算更加靠近数据的理念。

问：如果提前设置好代码下发到设备上去，AI也可以断网吗？

答：对，代码运行在你的设备上。两种情况：一种是我刚才演示的物联网的边缘计算。本身的代码包装下发到设备之后，在设备上运行，断网没有关系。

云函数本身也提供AI能力，在云上提供，所以在云上运行。

对于AI，云上产品化的速度会更快，目前我们已经在为部分客户进行支持，云上的相关操作说明后续也会提供出来，大家可以在线体验AI能力。

问：针对IoT这块腾讯云发布了没有？

答：这个还没有发布，还在产品化，目前也是和一些客户协同推进这个能力，物联网设备各种各样，包括底层的硬件环境，比如树莓派的ARM、X86、MIPS等平台，对于Linux里的内核功能、文件系统的支持，对于存储、内存、CPU的要求也在整理中。

问：云函数能够被用于传统应用吗？

答：云函数的特性因为本身是触发式运行，短暂运行的方式，所以和传统的很多开发单体的运行方式不太一样，更多是偏向于新业务开发、小的新业务上线或者急需要弹性应用能力的使用，传统的可以做改造，但到时候需要提供一些改造的建议。

效率提升更多是在业务开发的速度上，实际上对于业务运行环境不用再过多做运维性的动作，对于扩缩容也不用考虑，业务开发之后就可以上线，运维交给平台，扩缩容能力也是交给平台，为用户减轻压力，业务用量上来之后怎么承载业务，怎么保证业务不崩溃，云函数已经解决了这个问题，本身的扩容可以理解为无限能力的扩容、。

问：Serverless在线能力有没有额外的规划？Serverless的程序和代码能不能访问云主机上面的接口？

答：目前有在做很多，包括边缘计算、CDN以及和腾讯云的各种云产品打通，Serverless本身最大的价值在于和各个云产品打通之后的效能，可以认为是各个云产品之间的黏合剂或者是轻量级计算的联合。而和后端的对接，包括数据库、CVM直接打通，更多是网络上的问题，即将会推出和VPC网络的打通，用户VPC业务可以用云函数直接访问。

滴滴弹性云：从物理机到Kubernetes的那些坑与心得

本文根据谭霖老师在〖2017 GdevOps全球敏捷运维峰会北京站〗现场演讲内容整理而成。

讲师介绍

谭霖，滴滴出行弹性云架构师、云计算专家，曾任职于英特尔从事云计算方向研究。OpenStack Ironic 项目核心开发者，《OpenStack设计与实现》作者，多次在OpenStack Summit SRECon峰会上分享Topic。目前从事基于Kubernetes的私有云平台的研发，专注提高服务的稳定性和研发、运维效率。

今天我将带来一些关于滴滴弹性云的分享，标题是从物理机到Kubernetes的那些坑与心得。

先简单自我介绍下，我叫谭霖，之前曾在Intel从事于Open Stack相关的工作，也花了很大精力在开源社区这一方面，后来我来到滴滴的弹性云团队，主要从事基于Kubernetes的基础平台建设，可以说是从一个做菜的“厨师”变成了一个“食客”。

主题简介：

1. 整体架构

2. 产品功能

3. 方案细节

4. 心得展望

前言

在我们准备做弹性云时，我们问了自己三个问题：

1. 为什么要做私有云

2. 为什么选容器

3. 为什么选Kubernetes

为什么要做私有云

这个其实是最好回答的。因为滴滴的集群规模太大，有数万台物理机（这样的规模量要求我们做一个私有云平台），结果因为之前没有一个比较好的方案，造成了资源使用率特别低、资源浪费大的问题。

另一个主要原因是滴滴的发展太快，总有新的业务，隔一段时间就听说成立了一个新的部门，而且随着新需求的出现，更新迭代异常频繁，这些都对平台的稳定性提出了特别高的要求。这个问题靠堆人是解决不了的，所以需要有一个好的平台和机制来解决它。

为什么选容器

这个问题也比较好回答。KVM / Xen这样的传统虚拟化已经出现多年了，很稳定，但大家也知道其弊端，就是损耗比较大。另外，传统混部也就是滴滴现在在用的方案（即继续保持原有的传统混部），虽然能够部分解决资源使用率低的问题，但因为完全没有隔离，导致程序之间容易互相影响。

而容器是一个相对折中的方案，具有一定的隔离性、损耗更少，这是我们选择它的最主要原因。同时，更重要的是容器的镜像所带来新的玩法，因为镜像的环境是一致的，对运维人员特别友好，因此他们不用再关心那些纷繁复杂的配置文件，也不用频繁地走初始化流程，更不用每次上线更新都提心吊胆，担心会对新的服务造成影响。

为什么要选择Kubernetes

现在这个问题就比较容易回答，但一年前是个比较艰难的选择。大家都知道现在比较著名的容器平台有Mesos、Kubernetes 和Swarm，一年前我们在Mesos和Kubernetes之间犹豫过很久，后来主要觉得因为我们要做的是一个基于容器的平台，相比Mesos，Kubernetes更专注容器。

而Swarm当时还很年轻，很多功能不够完善，相较之下Kubernetes更成熟。当然更关键的原因是Kubernetes的社区更有活力，设计架构也更清晰，可拓展性也高。

现在回过头来看一年前的选择，非常很庆幸我们做了正确的选择，因为之前相较于两者，Kubernetes还只是旗鼓相当，而现在则有一统江山的趋势。我们目前还是基于Kubernetes1.6版本做的改造，接下来1.8版本release之后，我们会尽量跟上保持和社区同步。

一、整体架构

项目介绍

滴滴弹性云的目标就是基于容器技术，为滴滴提供稳定高效、可伸缩的服务管理平台。先简单看看弹性云的项目历程。

2016年7月，弹性云项目正式启动，然后10月份出了第一版，2017年4月，发布了第二版。在几个月的使用体验中，我们根据用户的反馈，不管是产品形式还是底层网络方案都经过大规模优化。目前第三版也正在开发中，这一版会更侧重用户交互和可视化上。

截止到目前为止，我们总共有300多台宿主机，2000+的容器实例，不算很多，但目前有多条滴滴核心业务线跑在我们的平台上，预见2018年规模会有指数型的上升。

整体目标

我们的整体目标有四点，主要是为了解决先前提出的三个问题，如下：

实现资源按需分配，提高资源利用率；
实现资源的弹性伸缩，可以快速响应负载变化；
基础环境保持一致，实现服务的快速交付；
保证服务的容错性，实现基础设施免运维。

解决方案

针对不同的产品线和需求，我们具体落地的产品解决方案主要分为两大块：一个是基于容器构建的轻量级虚拟机，叫做静态容器组；第二个是更纯粹的微服务类容器，我们称之为弹性伸缩组。同时我们还整合了滴滴现有的部署监控和日志收集系统。

这是整体的架构图，中间最大的一块就是我们的K8S集群，它主要分成控制节点和工作节点两部分。上面一块是我们的控制台和管理员入口，左边是滴滴的一些现有的权限认证系统和服务树，右边是我们的网络方案。

所以按照流程我们主要做的操作有用户先通过权限系统认证后，创建服务（也就是K8S的实例），实现容器的扩容缩容和部署更新。之后我们平台就会进行实时监控和日志收集，完成监控数据的上报和镜像拉取。

刚才说的主要是管理员相关的工作流程，现在看看用户流量。首先我们这边实现了每个容器通过IPAM组件，都能获取一个独立的IP，这个IP可以和物理机双向互通，所以允许用户的流量可以直接通过容器IP访问实例。同时我们也提供了一个4层的LB，允许用户可以通过只访问一个VIP，自动把流量打到后面的容器里。

二、产品功能

接下来详细讲讲滴滴弹性云具体的产品功能。

功能类型

正如之前所说，我们主要提供静态容器和动态伸缩两大产品，同时伸缩组方面又细分为有状态和无状态伸缩组。

其实在刚开始时，我们只想提供K8S支持得最好的Deployment，也就是无状态伸缩，这也是最符合容器使用习惯的产品形式。但在实际落地的过程中，我们发现完全不是那么一回事。

首先，不是所有程序都能比较轻易地改造成Cloud-Native的服务，所以针对这样的传统服务，我们还是需要提供一个比较贴近物理机的用户体验的产品，它的问题就是不能弹性伸缩，但好处是可以挂载本地存储，IP是恒定的。

同时为了支持有状态的服务，我们也提高了有状态伸缩组。既支持弹性伸缩又支持挂载网络存储。不过比较出人意料的是，用户选择有状态伸缩组的很大一部分原因并不是因为挂载Ceph，而是因为有状态伸缩组的容器IP/HostName是不变的，这样不管是从监控和日志上，都是更友好的。

而无状态伸缩我们这个当初最想推动的服务，也就只有在一些对弹性伸缩速度有特别高的要求的场景下才会用到。

功能特性

具体到产品功能的特性上，我们主要有三大块：复杂配置简单化、上线流程标准化和服务管理。

1.复杂配置简单化

了解过K8S的朋友们都清楚，它上手很难，有特别多的配置，有时候反而给用户带来了困扰。所以我们做了减法，简化了很多配置，只留给用户一些接口，避免不必要的困扰。比如我们支持多种接入方式，既可以一键完成从Git代码仓库到上线镜像的转换过程，也支持直接通过自定义镜像。

同时我们也对镜像做了分层（基础镜像→环境镜像→服务镜像），实现RD和SRE每个角色负责不同的镜像制作，这样分工更合理、层次更清晰，做到比较好的权责分明、高效有序。监控日志自动配置关联也是做了减法，希望用户较少关注这一点，从而得到更好的体验。

2.上线流程标准化

相对于减法来说，我们也做了很多的加法，因为我们是一个严肃的运维平台，之所以强调严肃，是因为只要有人参与的地方就容易犯错。一方面我们要尽量减少人工参与的地方，另一方面又要尽量通过各种规范来减少人犯错的机会。

比如变更审批系统，每一次上线变更都需要开发leader的审核；同时也对它进行了改造，使其每次分组小流量灰度；每次发布更新的过程中都有强制的观察时间，如果在观察过程中，比如说你发布了第二组后，发现你的更新过程中代码出了BUG，我们还支持了一键回滚。

3.服务管理

在服务管理方面，我们实现了服务不可用自动重启、一键扩容和负载均衡等，最为重要的就是对用户强制异地多活，必须在我们的两个机房都有实例。

三、方案细节

现在介绍我们的方案细节，主要包括网络监控、日志和镜像市场。

网络打通

1.SDN

我们的网络方案主要是基于Onos+OVS的SDN网络方案，每个容器都有一个区别于机房实体机的Overlay IP，容器与容器之间实现“大二层”互通，与机房网络之间通过交换机打通。物理机可以直接通过容器Overlay IP访问容器，反之亦然。

2.IP

在IP上，静态容器和伸缩容器都可以进行Hostname绑定，通过容器不变的Hostname保证容器在漂移到其它宿主后IP依旧保持不变，当容器发布更新时，它永远保持稳定。对于IP随机分配的情况，我们还提供了IP池，保证IP只会从IP池里出现。

3.负载均衡

我们使用弹性云独立的4层、7层负载均衡器，实现动态的负载均衡及故障自动剔除。

容器网络

1.架构

当前弹性云容器网络大体上分为三种类型：同宿主间的容器通信、跨主机间的容器通信，以及容器与物理机间的通信。

每一个部署容器的宿主机，都会部署一套Ovs网络组建，其中关键的就是两个Ovs Bridge，一个负责建立隧道与外界通信，叫Ovs-tunnel桥；一个负责整合本机上的容器通信，叫Ovs-int桥。所有的Ovs-tunnel都会与Onos的Controller建立连接，负责查询流表并建立流表和其他宿主机间的隧道。因此三种通信类型就可以解释为：

同宿主间的容器通信：直接通过Ovs-int桥通信，因此也不依赖Ovs-tunnel与外界的隧道。
跨主机间的容器通信：第一次通信时，Ovs-tunnel也会查询Onos，Onos返回目标容器的主机信息，Ovs-tunnel通过主机间的隧道，将容器数据发送到目的容器的宿主机，目的容器宿主机上的Ovs-tunnel则会将数据继续向上一层传递，经Ovs-int传递给容器。
容器与物理机间的通信：容器发送物理机的数据包，会被Ovs-tunnel经隧道发送给Overlay网关，Overlay网关进行Vxlan解包的操作，将数据传递到物理网络。相反地，物理机发送给容器的数据包，经Overlay网关把数据封包成Vxlan数据包，再通过隧道发往容器宿主，再由宿主传递给上一层的容器。

2.网络IP分配

具体到产品上，每个IP分配方案如下：

静态容器组：IP和Hostname恒定；
有状态伸缩组：IP和Hostname恒定，支持IP池；
无状态伸缩组：支持IP池，IP随机分配，灵活度更高。

3.创建过程

这个是容器网络创建的过程。一旦用户有创建容器需求时，控制节点会对整个集群做一个调度，选择一个合适的工作节点，而作为节点最重要核心的Kubelet就负责创建容器，控制节点会把需求发给它。

具体创建步骤如下：

Step1：当Kubelet收到调度到本Node的Pod信息后，会先创建一个无网络配置的Infrastructure的基础容器，此容器用于承载Pod中所有容器的网络Namespace；

Step2：Kubelet Exec启动CNIPlugin，并将第一步中创建的网络Namespace及Pod名称、容器ID等作为标准输入，传给新启动的Plugin进程；

Step3：CNIPlugin根据收到的参数，去IP Controller中申请容器的网络IP；

Step4：IP Controller会判断该容器属于哪一个子网，子网中是否有可用的IP，及是否有绑定的IP地址等，在根据计算出的IP地址及子网信息等，去SDN IPAM端申请虚拟Port（Overlay IP）；

Step5：IPAM会将创建好的虚拟Port返回API调用者IP Controller，并同时将信息同步给SDN Onos；

Step6：IP Controller 会将返回的Port保存在自己的存储库中。如果是绑定IP类型的Pod，它还会将该Pod与该虚拟Port（Overlay IP）进行绑定，则下一次该Pod再一次进行申请时，仍会申请到该Port（Overlay IP）。数据保存后，它会把Port信息再返回给CNIPlugin；

Step7：CNIPlugin收到Port信息后，会根据其中的Overlay IP、Gateway、Vlan Tag 等信息创建Veth Pair、配置Veth信息、配置路由、添加Ovs-brdge等操作。至此，本来没有任何网络的基础容器，就有了网络配置（除了与外部通信的Ovs网络外，同时也会添加Lo网络）；

Step8：CNIPlugin在成功配置完网络后，会将结果返回给Kubelet；

Step9：Kubelet会使用配置成功的基础容器的网络Namespace继续去创建其它的业务容器，如果配置失败了，会继续从第一步开始，继续创建基础容器，直到网络配置成功。

监控需求

监控主要有两方面需求：基础监控和业务监控。基础监控使用了Google开源容器监控软件Cadvisor/Cgroup作为监控数据来源，数据上报至Odin，同时可在Odin和弹性云页面上展开监控数据。

基础监控：物理机监控Agent无法采集到容器有效监控数据，Cadvisor、Proc、Cgroup容器基础监控项同物理机有明显差异，但用户的需求没变。
业务监控：业务监控同物理机需求完全一致，复用物理机监控方式。

这张图就是弹性云配置监控和查看监控的示意图，我们在每个物理机上有获取容器的基础监控指标，容器里面也会有获取业务指标。

日志需求

日志主要三个方面考虑：时效性、持久性，以及日志展示。

日志时效性：在线日志采集延迟2min，满足大多数场景，紧急情况下可以登录到容器内查看日志。
日志持久性：生成的容器直接拉到远端存储一份，选择分布式存储日志在Ceph存储一份。
日志展示：事后追溯有多种丰富的日志展示、分析系统。

这是我们在弹性云平台上创建容器的一个操作日志，也是一个简单的示意图。通常用户都打在容器里，而容器一旦发布更新，漂移之后数据都丢了，所以我们直接把日志打到Ceph上，用户不喜欢用这个的话可以直接打到远端，远端采集系统可以使用不同的系统，比如说ES和HDFS，这样就提供了更加丰富的日志展示和分析系统。

持久化存储

存储主要提供了本地卷和网络卷。

本地卷Host Path提供给静态容器组，我们把宿主机上的目录挂载到容器里作为数据存储卷，优势是稳定和读写性高。

网络卷Ceph的优势是多备份更可靠，支持容器迁移，缺点是网络抖动不可避免，所以得用Ceph的服务做改造，避免网络抖动影响整个服务的进程。

OverlayFS

我们选择Overlay FS作为存储，一方面是因为它的性能/稳定性更好，当然它也有不足，比如DeviceMapper可以通过LVM来解决磁盘的容量限制，但Overlay FS单靠本身是解决不了的，需要靠XFS来限制。

但我们发现在某些场景中XFS因为没有开启ftype功能，导致系统读写缓慢，因此我们建议大家如果也选用了Overlay FS+XFS方式，要把ftype设置为1。

镜像市场

镜像市场主要还是分层，目的是让不同的用户可以专注于不同的事情上。如下图所示：

基础环境镜像：弹性云管理员制作的镜像：FROM 官方镜像，增加了服务用到的各种Agent、常用软件、系统配置（添加User、日志切割等）的镜像。包揽最复杂的周边应用的整合，并兼顾将镜像做得更小。
服务环境镜像： SRE 同学制作和维护的镜像：FROM 基础环境镜像，安装了服务运行所需的环境、配置。更加专注服务环境的保障，使镜像满足产品线的使用。
服务镜像：使用 RD 代码中 Dockerfile（一般只需要COPY代码到线上所需目录即可），FROM 服务环境镜像，通过弹性云系统生成的提供服务的镜像。

四、心得与展望

心得体会

首先，特别想强调的是“云计算拼的是运维，拼的是可靠性”。产品做得再好、运维人不靠谱，出了纰漏后就没人敢再用你的东西了，说得再好也没用。

其次，“线上无小事，要对线上保持敬畏感”。我之前是做开源社区的，解决方案做得多，但现在做云计算方案时才发现实际与想象的差别特别大，可以说云计算落地更难。

也许大家看了一些网上的分享后都会觉得搭建一套容器环境是比较容易的，可最难的就像我们这样已经现有的体系，如果你要把它落地就需要做各种打通、妥协，甚至对一些功能做一些切割，有时这些不是我们想做的，但为了推进落地不得不去做。

此外，技术挑战是一方面，但用户习惯是更加大的挑战，特别是业务方，他们肯定会说为什么我要迁，现在用得好好的，即便你和他们说做这个是对公司省成本的，可以提高运维的便利性，他们依然会觉得我不缺钱，怕麻烦。再者，他们不是做运维的，感觉不到这些带来的明显好处。另一方面，有些用户觉得我上你的云可以，但你不要改变我的习惯，原来是什么样现在还得保持什么样。但问题是原来是物理机的用法，可现在已经上容器了，还想保持原来的方式，这是不可能的。

运维是一个特别苦的职业，线上无小事，一点点小改动，如果没有考虑清楚、没有充分验证过回滚方案，那分分钟要出事，相信大家也深谙此理。

未来展望

对于弹性云的未来规划，第一是更细粒度的隔离。大家对容器比较了解的话，就会清楚现在Docker更多的是对Memory使用量的隔离，以及对CPU使用量的隔离。但实际过程中我们会发现，比如你给用户一个8G内存，在某种极端配置下8G内存会不断地刷新读写，那你的L3 Cache很快就会被刷爆了,导致大量的Cache Miss，这样的话还是会对程序性能造成很大影响的。

第二是静态容器的弹性伸缩。因为静态容器确实就像虚拟机一样，运维成本特别高，所以一旦物理机挂了，容器也就挂了，很多东西是找不回来的。而且你要扩容也只能按照传统的方法，先申请一个容器再去上面做部署、配置等，这些都会给运维同学带来非常大的困扰。

第三是更智能的扩容算法。目前我们是根据实时的使用率来进行扩容，但其实对于我们来说，很多业务高峰期是有规律的，如果能做到提前预测出高峰期，做适应的扩容，那将会极大地提高资源使用率。

最重要的一点是依托社区、回馈社区。我们打算腾出手来，把一些定制化需求不是那么高的解决方案来回馈到社区。

人工智能赛博物理操作系统

AI-CPS OS

“人工智能赛博物理操作系统”（新一代技术+商业操作系统“AI-CPS OS”：云计算+大数据+物联网+区块链+人工智能）分支用来的今天，企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中，利用AI-CPS OS形成数字化+智能化力量，实现行业的重新布局、企业的重新构建和自我的焕然新生。

AI-CPS OS的真正价值并不来自构成技术或功能，而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化，这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合，没有颠覆现状的意愿，这些将不可能实现。

领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量，领导者必须在行业、企业与个人这三个层面都保持领先地位：

重新行业布局：你的世界观要怎样改变才算足够？你必须对行业典范进行怎样的反思？
重新构建企业：你的企业需要做出什么样的变化？你准备如何重新定义你的公司？
重新打造自己：你需要成为怎样的人？要重塑自己并在数字化+智能化时代保有领先地位，你必须如何去做？

AI-CPS OS是数字化智能化创新平台，设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端，可以帮助企业将创新成果融入自身业务体系，实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉，形成了领导力模式，使数字化融入到领导者所在企业与领导方式的核心位置：

精细：这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切，进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能：模型随着时间（数据）的变化而变化，整个系统就具备了智能（自学习）的能力。
高效：企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力，这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性：数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验，其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域：技术、文化、制度。
边界模糊：数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化，还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长：

创造虚拟劳动力，承担需要适应性和敏捷性的复杂任务，即“智能自动化”，以区别于传统的自动化解决方案；
对现有劳动力和实物资产进行有利的补充和提升，提高资本效率；
人工智能的普及，将推动多行业的相关创新，开辟崭新的经济增长空间。

给决策制定者和商业领袖的建议：

超越自动化，开启新创新模式：利用具有自主学习和自我控制能力的动态机器智能，为企业创造新商机；
迎接新一代信息技术，迎接人工智能：无缝整合人类智慧与机器智能，重新
评估未来的知识和技能类型；
制定道德规范：切实为人工智能生态系统制定道德准则，并在智能机器的开
发过程中确定更加明晰的标准和最佳实践；
重视再分配效应：对人工智能可能带来的冲击做好准备，制定战略帮助面临
较高失业风险的人群；
开发数字化+智能化企业所需新能力：员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说，创造兼具包容性和多样性的文化也非常重要。

子曰：“君子和而不同，小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和人工智能，像君子一般融合，一起体现科技就是生产力。

如果说上一次哥伦布地理大发现，拓展的是人类的物理空间。那么这一次地理大发现，拓展的就是人们的数字空间。在数学空间，建立新的商业文明，从而发现新的创富模式，为人类社会带来新的财富空间。云计算，大数据、物联网和区块链，是进入这个数字空间的船，而人工智能就是那船上的帆，哥伦布之帆！

新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力，将进一步释放历次科技革命和产业变革积蓄的巨大能量，并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节，形成从宏观到微观各领域的智能化新需求，催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革，深刻改变人类生产生活方式和思维模式，实现社会生产力的整体跃升。

产业智能官 AI-CPS

用“人工智能赛博物理操作系统”（新一代技术+商业操作系统“AI-CPS OS”：云计算+大数据+物联网+区块链+人工智能），在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能；实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。

长按上方二维码关注微信公众号： AI-CPS，更多信息回复：

新技术：“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”；新产业：“智能制造”、“智能金融”、“智能零售”、“智能驾驶”、“智能城市”；新模式：“财富空间”、“工业互联网”、“数据科学家”、“赛博物理系统CPS”、“供应链金融”。

官方网站：AI-CPS.NET

本文系“产业智能官”（公众号ID：AI-CPS）收集整理，转载请注明出处！

【云计算】从Serverless说起，谈谈边缘计算的未来；从物理机到Kubernetes的那些坑与心得

滴滴弹性云：从物理机到Kubernetes的那些坑与心得

猜你喜欢