1、问题描述

年前,同事升级K8s调度器至1.28.3,观察到内存异常现象,帮忙一起看看,在集群pod及node随业务潮汐变动的情况下,内存呈现不断上升的趋势,直至OOM.(下述数据均来源自社区)

图片图片

触发场景有以下两种(社区还有其他复现方式):

Case 1

for (( ; ; ))
do
    kubectl scale deployment nginx-test --replicas=0 
    sleep 30
    kubectl scale deployment nginx-test --replicas=60
    sleep 30
done