本文首发于我的公众号 cloud_dev,专注于干货分享,号内有大量书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫。
Hi,大家好,我是 CloudDeveloper,欢迎大家和我一起学 K8S,这是系列第 12 篇。
上一篇我们了解了 Pod 的手动扩容和缩容,本篇来看看自动的方式。
K8S 作为一个集群式的管理软件,自动化、智能化是免不了的功能。Google 在 K8S v1.1 版本中就加入了这个 Pod 横向自动扩容的功能(Horizontal Pod Autoscaling,简称 HPA)。
HPA 与之前的 Deployment、Service 一样,也属于一种 K8S 资源对象。
HPA 的目标是希望通过追踪集群中所有 Pod 的负载变化情况,来自动化地调整 Pod 的副本数,以此来满足应用的需求和减少资源的浪费。
HAP 度量 Pod 负载变化情况的指标有两种:
- CPU 利用率(CPUUtilizationPercentage)
- 自定义的度量指标,比如服务在每秒之内的请求数(TPS 或 QPS)
如何统计和查询这些指标,要依托于一个组件——Heapster。Heapster 会监控一段时间内集群内所有 Pod 的 CPU 利用率的平均值或者其他自定义的值,在满足条件时(比如 CPU 使用率超过 80% 或 降低到 10%)会将这些信息反馈给 HPA 控制器,HPA 控制器就根据 RC 或者 Deployment 的定义调整 Pod 的数量。
HPA 实现的方式有两种:配置文件和命令行
- 配置文件
这种方式是通过定义 yaml 配置文件来创建 HPA,如下是基本定义:
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: php-apache
namespace: default
spec:
scaleTargetRef: # (1)
kind: Deployment
name: php-apache
minReplicas: 1 # (2)
maxReplicas: 10
targetAverageUtilization: 50 # (3)
文件 kind 类型是 HorizontalPodAutoscaler
,其中有 3 个地方需要额外注意下:
(1)scaleTargetRef
字段指定需要管理的 Deployment/RC 的名字,也就是提前需要存在一个 Deployment/RC 对象。
(2) minReplicas
和 maxReplicas
字段定义 Pod 可伸缩的数量范围。这个例子中扩容最高不能超过 10 个,缩容最低不能少于 1 个。
(3)targetAverageUtilization
指定 CPU 使用率,也就是自动扩容和缩容的触发条件,当 CPU 使用率超过 50% 时会触发自动动态扩容的行为,当回落到 50% 以下时,又会触发自动动态缩容的行为。
- 命令行
这种方式就是通过 kubectl autoscale
命令来实现创建 HPA 对象,实现自动扩容和缩容行为。比如和上面的例子等价的命令如下:
kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
通过参数来引入各个字段。
OK,本文就到这里,更多实践的例子大家可以参考 K8S 官网。下文我们将会探索 K8S 的容错机制。
我的公众号 cloud_dev,号内有大量书籍和视频资源,后台回复「1024」即可领取,分享的内容包括但不限于云计算虚拟化、容器、OpenStack、K8S、雾计算、网络、工具、SDN、OVS、DPDK、Linux、Go、Python、C/C++编程技术等内容,欢迎大家关注。