阿里云容器服务使用HPA弹性伸缩容器

前言

弹性伸缩是开发者使用容器过程中非常关注的特性,如果从资源类型的角度来讲,可以分为物理资源的弹性伸缩与容器资源的弹性伸缩。在本篇中,主要向大家介绍的是容器资源的弹性伸缩,在Kubernetes中,HPA(Horizontal Pod Autoscaling)是用来抽象容器水平弹性伸缩的概念。开发者可以通过定义HPA的yaml配置,快速实现容器水平伸缩。

原理

lALPBY0V45V4xWfNAeDNAho_538_480_png_620x10000q90g
在Kubernetes中,Pod的负载是通过Heapster进行采集的(新版本中可以通过Metrics Server进行采集),HPA Controller通过定期(定期轮询的时间通过–horizontal-pod-autoscaler-sync-period选项来设置,默认的时间为30秒)查询Pod当前系统的负载来自动水平扩容,如果系统负载超过预定值,就开始增加Pod的个数,如果低于某个值,就自动减少Pod的个数。

使用方式

下面我们针对一个Nginx应用进行举例:

apiVersion: apps/v1beta2 # for versions before 1.8.0 use apps/v1beta1
kind: Deployment
metadata:
  name: nginx
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx  
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9 # replace it with your exactly <image_name:tags>
        ports:
        - containerPort: 80
        resources:
          requests:
            cpu: 500m

创建HPA,通过scaleTargetRef设置当前HPA绑定的对象,在本例中绑定是名叫nginxDeployment

apiVersion: autoscaling/v2beta1
kind: HorizontalPodAutoscaler
metadata:
  name: nginx-hpa
  namespace: default
spec:
  scaleTargetRef:
    apiVersion: apps/v1beta2
    kind: Deployment
    name: nginx
  minReplicas: 1
  maxReplicas: 10
  metrics:
  - type: Resource
    resource:
      name: cpu
      targetAverageUtilization: 50

注意:HPA需要给Pod设置request资源,如果没有request资源,HPA是不会运行的,kubectl describe hpa [name]会发现有类似如下的warnning。

Warning  FailedGetResourceMetric       2m (x6 over 4m)  horizontal-pod-autoscaler  missing request for cpu on container nginx in pod default/nginx-deployment-basic-75675f5897-mqzs7

Warning  FailedComputeMetricsReplicas  2m (x6 over 4m)  horizontal-pod-autoscaler  failed to get cpu utilization: missing request for cpu on container nginx in pod default/nginx-deployment-basic-75675f5

创建好HPA后,我们再次执行kubectl describe hpa [name]命令,可以看到如下信息,则表示HPA已经正常运行。

Normal   SuccessfulRescale             39s              horizontal-pod-autoscaler  New size: 1; reason: All metrics below target

此时当Nginx的Pod的利用率超过如上图所示的50%的利用率时,则会进行水平扩容,低于50%的时候会进行缩容。

使用容器服务部署支持HPA的Deployment

在阿里云容器服务中,已经集成了HPA,开发者可以非常简单的通过UI进行创建。

  1. 点击左侧菜单的部署,选择镜像创建
    lALPBY0V45V_bfrNAtjNBMw_1228_728_png_620x10000q90g
  2. 填写应用的名称和相应的配置信息,设置资源的所需资源。
    lALPBY0V45V_bmHNAtjNBMw_1228_728_png_620x10000q90g
  3. 勾选自动伸缩的开启,设置伸缩的条件和配置。
    lALPBY0V45V_bojNAtjNBMw_1228_728_png_620x10000q90g
  4. 此时一个支持HPA的Deployment就已经创建完毕了,可以在部署的详情中查看伸缩组信息。
    lALPBY0V45V_brfNAzzNBMw_1228_828_png_620x10000q90g
  5. 验证弹性伸缩,通过给Pod进行CPU压测,可以发现Pod在半分钟内即可完成水平的扩展。
    lALPBY0V45V_bvfNAzzNBMw_1228_828_png_620x10000q90g

最后

HPA是Kubernetes中最常使用的伸缩方式,除此之外,HPA还可以结合autoscaler同时使用,当HPA弹出的容器无法进行调度的时候,autoscaler会自动弹出节点,并将HPA所期望的容器运行在弹出的节点上。关于autoscaler的部分,可以参考阿里云上弹性伸缩kubernetes集群 - autoscaler

猜你喜欢

转载自yq.aliyun.com/articles/607845