K8s--HPA(容器水平伸缩)

一、HPA伸缩过程

收集HPA控制下所有Pod最近的cpu使用情况(CPU utilization)
对比在扩容条件里记录的cpu限额(CPUUtilization)
调整实例数(必须要满足不超过最大/最小实例数)
每隔30s做一次自动扩容的判断
CPU utilization的计算方法是用cpu usage(最近一分钟的平均值,通过metrics可以直接获取到)除以cpu request(这里cpu request就是我们在创建容器时制定的cpu使用核心数)得到一个平均值,这个平均值可以理解为:平均每个Pod CPU核心的使用占比。

1.拉取相关镜像并上传到私有仓库

docker pull mirrorgooglecontainers/hpa-example   %拉取镜像
docker push reg.westos.org/library/hpa-example:latest   %上传到私有仓库

在这里插入图片描述

2.配置启动一个 Deployment 来运行这个镜像并暴露一个服务

vim php-apache.yaml:
apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-apache
spec:
  selector:
    matchLabels:
      run: php-apache
  replicas: 1
  template:
    metadata:
      labels:
        run: php-apache
    spec:
      containers:
      - name: php-apache
        image: hpa-example  %需要更改这个路径
        ports:
        - containerPort: 80
        resources:
          limits:
            cpu: 500m
          requests:
            cpu: 200m
---
apiVersion: v1
kind: Service
metadata:
  name: php-apache
  labels:
    run: php-apache
spec:
  ports:
  - port: 80
  selector:
    run: php-apache

在这里插入图片描述
在这里插入图片描述

3.创建 Horizontal Pod Autoscaler

下面的指令将创建一个 Horizontal Pod Autoscaler 用于控制我们上一步骤中创建的 Deployment,使 Pod 的副本数量维持在 1 到 10 之间。 大致来说,HPA 将(通过 Deployment)增加或者减少 Pod 副本的数量以保持所有 Pod 的平均 CPU 利用率在 50% 左右(由于每个 Pod 请求 200 毫核的 CPU,这意味着平均 CPU 用量为 100 毫核)。

kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10 
kubectl get hpa  %查看创建的hpa状态

在这里插入图片描述
**当前的 CPU 利用率是 0%,这是由于我们尚未发送任何请求到服务器。 **

4.增加负载

现在,我们将看到 Autoscaler 如何对增加负载作出反应。 我们将启动一个容器,并通过一个循环向 php-apache 服务器发送无限的查询请求 (请在另一个终端中运行以下命令)

kubectl run -i --tty load-generator --rm --image=busybox --restart=Never -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://php-apache; done"  %私有仓库中需要有busybox镜像

5.测试效果

我们可以通过步骤四中的增加负载操作来测试cpu负载的动态伸缩情况:

kubectl get hpa   %查看hpa状态

在这里插入图片描述

二、内存的动态伸缩

1.编辑hpa-v2.yaml文件并应用

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: hpa-example
spec:
  maxReplicas: 10
  minReplicas: 1
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        averageUtilization: 60
        type: Utilization
  - type: Resource
    resource:
      name: memory
      target:
        averageValue: 50Mi
        type: AverageValue

2.增加负载并测试

kubectl run -i --tty load-generator --rm --image=busybox --restart=Never -- /bin/sh -c "while sleep 0.01; do wget -q -O- http://php-apache; done"

在这里插入图片描述

三、停止负载

在我们创建 busybox 容器的终端中,输入 + C 来终止负载的产生。
然后我们可以再次检查负载状态(等待几分钟时间)

kubectl get hpa    %查看hpa中cpu利用率
kubectl get deployment php-apache   %查看副本数量

CPU 利用率将会逐渐降到0,因此HPA 也将逐渐缩减副本数量至1(这个过程可能需要花费几分钟的时间)

猜你喜欢

转载自blog.csdn.net/nk298120/article/details/115241902