当前位置：首页 > news >正文

Kubernetes控制平面组件：调度器Scheduler（一）

news 来源：原创 2025/8/3 1:54:53

云原生学习路线导航页（持续更新中）

kubernetes学习系列快捷链接
- Kubernetes架构原则和对象设计（一）
- Kubernetes架构原则和对象设计（二）
- Kubernetes架构原则和对象设计（三）
- Kubernetes控制平面组件：etcd（一）
- Kubernetes控制平面组件：etcd（二）
- Kubernetes控制平面组件：API Server详解（一）
- Kubernetes控制平面组件：API Server详解（二）
- Kubernetes控制平面组件：调度器Scheduler（一）
- Kubernetes控制平面组件：调度器Scheduler（二）

本文是kubernetes的控制面组件调度器Scheduler第一篇，首先介绍了kubernetes调度器的基础、核心原理，然后分别介绍了调度过程的2个阶段：Predicates&Priority，之后详细介绍了Pod资源配置基于cgroups的底层原理，以及pod资源对kubernetes调度器的作用，最后还给出了kube-scheduler源码分析的关键点

希望大家多多点赞关注评论收藏，作者会更有动力继续编写技术文章

1.kube-scheduler基础

1.1.kube-scheduler介绍

1.1.1.scheduler是什么

在这里插入图片描述

scheduler是什么
- Kubernetes调度器（kube-scheduler）是集群资源调度的核心组件，负责将未绑定节点的Pod分配到满足资源需求和策略约束的Worker节点上。
scheduler核心功能
- 资源优化：基于CPU、内存等资源请求，均衡节点负载，避免局部热点。
- 策略执行：支持亲和性（Affinity）、反亲和性（Anti-Affinity）、污点容忍（Taints/Tolerations）等规则。
- 高可用性：通过分布式调度避免单点故障，支持多调度器共存。
- 扩展性：通过插件化架构（Scheduling Framework）支持自定义调度逻辑。

1.1.2.调度器如何标记pod该调度到哪个节点？

通过Pod的NodeName字段。
调度器监听所有没有设置NodeName的pod，然后通过一系列调度算法计算出调度到哪个Node上，然后将Node写入pod的NodeName字段
后续由对应Node上的kubelet负责将Pod容器拉起来

1.1.3.scheduler本质也是一个生产者-消费者模型

生产者：scheduler通过 list-informer 机制监听api-server的pod事件，将未调度的pod的name放入一个队列中，等待调度
消费者：scheduler还包括一些worker，监听队列，取出podName，对相应的pod进行调度

1.1.4.调度需要考虑什么因素

优先级：保证高优先级优先调度，以及资源不足时是否可抢占…
公平性：同一优先级下，如何保证公平性，比如先进先出
资源高效利用：资源可以分成可压缩、不可压缩两类，调度的时候需要考虑多元资源调度，比如同时存在多个节点符合资源条件时，怎么调度能保证资源使用率更高
Qos：考虑pod调度在node上的服务质量
亲和、反亲和性：比如两个相关的服务，被调度在同一台机器，在发生调用的时候就不是网络调用，不会走到物理网卡，效率和稳定性都会更高
数据本地化：大多是在大数据领域出现，大数据领域大都有很多待处理的文件，那么调度的时候就有两种情况：1）pod启动后网络传输文件；2）直接调度到存在该文件的那几台机器上，把进程/作业传过去，避免传输大量数据，作业找数据
内部负载干扰
deadlines

1.2.kube-scheduler核心原理

在这里插入图片描述

声明式调度：基于Pod的资源请求和策略定义，而非命令式指令。
调度队列管理：
- Active Queue：存储待调度Pod，按优先级排序（如Pod优先级类）。
- Backoff Queue：存放调度失败的Pod，采用指数退避机制重试。
调度缓存（Scheduler Cache）：
- 维护集群节点和Pod的实时状态，减少对API Server的直接访问。
调度流程：
- 预选（Predicates）：过滤不满足资源请求、端口冲突或策略限制的节点。
- 优选（Priorities）：计算节点得分（如资源利用率、亲和性权重），选择最优节点。
- 绑定（Binding）：将Pod与节点绑定，触发kubelet启动容器。
插件化架构：通过Scheduling Framework定义扩展点（如predicate、priority都允许自定义调度策略），支持按需扩展调度逻辑。

1.3.与其他调度系统的对比

系统	核心差异
Docker Swarm	仅支持简单策略（如节点标签），缺乏K8s的插件化扩展能力。
Apache Mesos	通用资源调度框架，支持非容器负载，但容器生态和调度策略灵活性不及K8s。
OpenShift	基于K8s增强企业级功能（如安全策略、CI/CD集成），但核心调度逻辑与K8s一致。
Nomad	支持多类型工作负载（容器、VM），但缺乏K8s的丰富调度插件和生态系统。

2.kube-scheduler调度计算：Predicate阶段

2.1.Predicates 工作原理

Predicates阶段包含很多Plugin插件，用于过滤不满足条件的node，每运行完一些Plugin，满足条件的Node就会越少。
最开始输入为All Nodes，所有插件运行完成，最终剩下的就是满足条件的 Node List

2.2.Predicates 常见 Plugins

kube-scheduler是插件化设计，拥有很多Predicate插件
这里仅列出一些常用的调度策略，实际上还有很多其他的，另外也支持自定义调度predicates策略

2.2.1.PodFitsHostPorts

功能：检查候选节点是否存在 HostPort 端口冲突。
原理：遍历节点上所有已绑定 hostPort 的 Pod，若当前 Pod 声明的 hostPort 已被占用，则过滤该节点。
场景：适用于使用 hostNetwork: true 的 Pod，避免端口冲突（如 Nginx 监听 80 端口）。

2.2.2.PodFitsPorts

功能：与 PodFitsHostPorts 功能相同，可能是旧版本别名或笔误。
注意：实际调度器中无此插件，应为 PodFitsHostPorts 的重复描述，建议以 PodFitsHostPorts 为准。

2.2.3.PodFitsResources

功能：验证节点 资源是否充足（CPU、内存、GPU、Pod 配额等）。
原理：比较节点剩余资源与 Pod 的 requests，若满足以下条件则通过：
节点可分配资源 ≥ Pod 请求资源。
节点 Pod 数量未超过 PodPerCore 或 MaxPods 限制。
公式：节点可分配资源 = 节点总资源 - 已分配资源 - 系统预留资源。

2.2.4. HostName

功能：强制 Pod 调度到 pod.Spec.NodeName 指定的节点。
原理：仅当候选节点的名称与 NodeName 完全匹配时通过检查。
场景：用于直接指定节点（如 DaemonSet 或运维手动调度）。

2.2.5. MatchNodeSelector

功能：校验候选节点 标签是否匹配 Pod 的 nodeSelector 或 nodeAffinity。
原理：检查节点标签是否满足 Pod 的 spec.affinity.nodeAffinity 或 spec.nodeSelector 条件。
示例：若 Pod 要求 disk=ssd，则仅调度到有此标签的节点。

2.2.6. NoVolumeZoneConflict

功能：确保 Pod 使用的 持久卷（PV）与节点处于同一可用区。
原理：检查 PV 的 topology.kubernetes.io/zone 标签与节点标签是否一致，避免跨区域访问导致延迟或故障。
场景：云环境（如 AWS/Azure）中基于可用区（Availability Zone）的容灾部署。

2.2.7.MatchInterPodAffinity

功能：检查 Pod 是否满足与其他 Pod 的亲和性/反亲和性规则。
原理：基于 podAffinity 和 podAntiAffinity 配置，验证候选节点上已运行 Pod 的标签是否满足目标 Pod 的拓扑约束（如共置或隔离要求）。

2.2.8.NoDiskConflict

功能：检查候选节点是否存在 存储卷冲突（仅限于特定云存储）。
原理：验证节点是否已挂载相同存储卷（如 GCE PD、AWS EBS、Ceph RBD、iSCSI），避免多 Pod 同时读写导致数据损坏。
限制：仅适用于需要独占访问的块存储类型。

2.2.9.PodToleratesNodeTaints

功能：检查 Pod 是否容忍节点的 污点（Taints）。
原理：将 Pod 的 tolerations 与节点 taints 列表匹配，若存在匹配的容忍规则则允许调度。
场景：控制 Pod 调度到专用节点（如 GPU 节点需容忍 nvidia.com/gpu:NoSchedule）。

2.2.10.CheckNodeMemoryPressure

功能：判断 Pod 能否调度到存在 内存压力 的节点。
原理：若节点报告 MemoryPressure 状态，则仅允许调度 Burstable/BestEffort QoS 级别的 Pod（无内存 requests 限制的 Pod）。

2.2.11.CheckNodeDiskPressure

功能：判断 Pod 能否调度到存在 磁盘压力 的节点。
原理：若节点报告 DiskPressure 状态，则禁止调度新 Pod（系统守护进程 Pod 除外），防止磁盘资源耗尽。

2.2.12.NoVolumeNodeConflict

功能：检查节点是否满足 Pod 引用 Volume 的 访问条件。
原理：验证节点是否符合 Volume 的 nodeAffinity 或访问模式（如 ReadWriteOnce 要求独占挂载）。
示例：本地持久卷（Local PV）需通过节点选择器绑定特定节点。

3.kube-scheduler调度计算：Priority 阶段

3.1.Priority工作原理

Priority 阶段就是在打分，把经过Predicates阶段过滤后剩余的满足条件node list，经过一系列Priority策略的打分后，最终每个node都得到一个分数，取分数最高的node作为调度节点
注意：Priority策略并非同等重要，每一个Priority策略都有权重，在计算分数时，node得分计算公式：node得分=求和（每个策略得分*权重）

3.2.Priority 常见Plugins

kube-scheduler是插件化设计，拥有很多Priority插件
这里仅列出一些常用的调度策略，实际上还有很多其他的，另外也支持自定义调度Priority策略

3.2.1.SelectorSpreadPriority

功能：优先减少节点上属于同一 Service/ReplicationController 的 Pod 数量。
原理：通过计算节点上已运行的同服务 Pod 数量，选择同类 Pod 分布最分散 的节点，提升服务容灾能力。
场景：部署高可用服务（如 Web 前端）时避免单节点过载。

3.2.2.InterPodAffinityPriority

功能：优先将 Pod 调度到满足 Pod间亲和性/反亲和性规则 的拓扑域。
原理：根据 podAffinity/podAntiAffinity 配置，匹配相同或不同拓扑域（节点/Rack/Zone）的 Pod 分布。
示例：数据库与缓存服务需共置（亲和性），或同类服务跨可用区部署（反亲和性）。

3.2.3.LeastRequestedPriority

功能：优先调度到 资源请求量少 的节点。优先调度到能满足要求并且剩余资源最少的节点
原理：基于节点剩余资源比例计算得分，公式：
得分 = (CPU剩余量 / CPU总量 + 内存剩余量 / 内存总量) / 2 * 10
优势：最大化资源利用率，适合资源密集型应用（如大数据任务）。
缺点：可能造成大量pod调度到相同node，使得部分node压力大，部分node很空

3.2.4.BalancedResourceAllocation

功能：优先平衡各节点的 资源使用比例。优先调度到能满足要求并且剩余资源最多的节点
原理：计算节点 CPU 和内存使用率的方差，选择资源消耗最均衡的节点，公式：
得分 = 10 - (|CPU使用率 - 内存使用率|) * 10
场景：避免节点出现 CPU 过载但内存空闲（或反之）的资源碎片问题。

3.2.5.NodePreferAvoidPodsPriority

功能：依据节点注解 alpha.kubernetes.io/preferAvoidPods 决策调度权重。
原理：若节点存在此注解，则为该节点赋予 固定权重 10000，覆盖其他优先级策略。
用途：强制调度/驱逐特定 Pod（如系统关键组件），需谨慎使用（可能破坏常规调度逻辑）。

3.1.6.调度权重对比

插件名称	默认权重	优先级覆盖能力
NodePreferAvoidPodsPriority	10000	最高（覆盖其他策略）
InterPodAffinityPriority	1000	高
BalancedResourceAllocation	1	低

4.Pod资源配置底层原理

4.1.Pod的三种服务质量Qos

在这里插入图片描述

4.1.1.QoS 核心概念

QoS（Quality of Service）是 Kubernetes 用于管理 Pod 资源分配与驱逐优先级的核心机制。
QoS通过 Pod 容器的资源请求（requests）和限制（limits）配置自动分配 QoS 类别，决定资源紧张时 Pod 的驱逐顺序。

4.1.2.QoS 分类规则

4.1.2.1.Guaranteed 有保证的（最高优先级）

核心条件：
- 所有容器必须同时设置 CPU 和内存的 requests 和 limits；
- 每个容器的 requests 必须等于 limits（如 cpu: 500m，memory: 1Gi）。
特点：
- 资源完全保障，仅在 Pod 自身超限或节点无更低优先级 Pod 时被驱逐；
- 可使用独占 CPU 核（通过 static CPU 管理策略）。

4.1.2.2.Burstable 可超售的（中优先级）

核心条件：
- 不满足 Guaranteed 条件；
- 至少一个容器设置了 CPU 或内存的 requests 或 limits。
特点：
- 资源使用有下限保障，但允许弹性扩展（如未设 limits 时默认使用节点剩余资源）；
- 驱逐优先级低于 BestEffort，但高于 Guaranteed。

4.1.2.3.BestEffort 尽力而为的（最低优先级）

核心条件：
- 所有容器均未设置 CPU 和内存的 requests 和 limits。
特点：
- 无资源保障，优先被驱逐；
- 适用于非关键任务（如日志收集）以最大化资源利用率。

4.1.3.QoS 对资源管理的具体影响

4.1.3.1.调度与资源分配

调度依据：Kubernetes 调度器仅基于 requests 分配节点，limits 不影响调度；
- 比如一个node只有4个cpu，配置limits.cpu==5没有问题，可以调度。但是如果配置requests.cpu==5，pod就会一直Pending，事件报错 InSufficient Cpu 即cpu不足。
资源使用限制：
- CPU（可压缩资源）：超限时被节流（Throttled），但进程不被终止；
- 内存（不可压缩资源）：超限时触发 OOM Killer，进程被终止3,7。
调度器完成调度后，会把对应node上的资源信息，扣除掉这个requests
- 比如在node中可以看到总资源、可分配资源（去除系统预留资源之后的）
- 调度器看node是否满足资源要求时，看的就是这里

4.1.3.2.不同QoS适用业务

核心服务：使用 Guaranteed 确保稳定性（如数据库）
弹性服务：Burstable 适合 Web 服务等需灵活扩展的场景
临时任务：BestEffort 用于批处理或监控工具
节点分级：结合节点亲和性策略将不同 QoS Pod 调度到专用节点

4.1.4.Pod资源限制的生效原理：cgroups

4.1.4.1.核心机制概述

Kubernetes 通过 cgroups 实现 Pod 资源限制的运行时控制
Requests：仅影响调度决策，确保节点有足够资源容纳 Pod
Limits：通过 cgroups 硬性限制容器运行时资源使用
资源类型差异：
可压缩资源（CPU）：超限时被节流（Throttling）
不可压缩资源（内存）：超限时触发 OOM Killer

4.1.4.2.CPU 资源实现细节

4.1.4.2.1.前置知识：CPU 的m是什么单位

在声明资源时，经常看到100m的cpu，这个m如何解释呢？
- 在虚拟机中，资源限制粒度是非常粗的，cpu至少要是1个，那么如何限制一个应用对cpu更细粒度的资源需求呢？
- m是一个1/1000的单位，1m即为1/1000个cpu。但cpu是个物理的，没办法分，只能从时间片上看，1个cpu一般是100000us（10w us），所以1/1000个cpu即为大约 100us。

4.1.4.2.2.CPU Requests 映射

通过 cpu.shares 控制 CPU 时间片分配比例

注：cpu.shares 是软限制，在存在多个进程时，通过 cpu.shares 控制时间分配比例

# 计算方式
cpu.shares = requests.cpu * 1024
# 示例：requests.cpu=500m → cpu.shares = 500*1/1000*1024 = 512
# 其中 m==1/1000

仅在 CPU 资源争抢时生效，空闲 CPU 可超用

Pod cpu Requests 配置路径示例：

/sys/fs/cgroup/cpu/kubepods/pod<pod-uid>/<container-id>/cpu.shares

4.1.4.2.2.CPU Limits 映射

通过 CFS 配额机制 实现硬性限制：
cpu.cfs_period_us：调度周期（默认 100ms==100000us）

cpu.cfs_quota_us：当前进程周期内可用的 CPU 时间

# 计算方式
quota = limits.cpu * period
# 示例：limits.cpu=1 → quota=100000μs (100ms)
# 其中 m==1/1000

Pod cpu Limits路径示例：

/sys/fs/cgroup/cpu/kubepods/pod<pod-uid>/<container-id>/cpu.cfs_quota_us

4.1.4.3. 内存资源实现细节

4.1.4.3.1 内存 Limits 映射

通过 memory.limit_in_bytes 设置内存使用上限：

# 示例：limits.memory=512Mi → 536870912
cat /sys/fs/cgroup/memory/kubepods/pod<pod-uid>/<container-id>/memory.limit_in_bytes

超限时触发 OOM Killer，容器被强制终止
memory 无对应 Requests 的 cgroups 参数（仅影响调度）

4.1.4.3.2 内存软限制（特殊场景）

通过 memory.soft_limit_in_bytes 设置柔性限制：

# 示例（需手动配置）：
echo 268435456 > /sys/fs/cgroup/memory/.../memory.soft_limit_in_bytes

Kubernetes 默认不配置该参数

4.1.4.4. 多级 cgroups 控制

Kubernetes 采用分层控制策略：

kubepods (根cgroup)
├── burstable (QoS级别)
│   └── pod-uid (Pod级)
│       └── container-id (容器级)
├── besteffort
└── guaranteed

QoS 级控制：不同 QoS 类别 Pod 的隔离策略
Pod 级控制：聚合所有容器的资源限制
容器级控制：实际执行资源限制的最小单元

4.1.4.5. 完整配置示例

4.1.4.5.1 Pod 定义

apiVersion: v1
kind: Pod
spec:containers:- name: demoimage: nginxresources:requests:cpu: "500m"memory: "256Mi"limits:cpu: "1"memory: "512Mi"

4.1.4.5.2 生成的 cgroups 配置

# CPU 控制文件
/sys/fs/cgroup/cpu/kubepods/burstable/pod-xxx/cpu.shares → 512
/sys/fs/cgroup/cpu/kubepods/burstable/pod-xxx/cpu.cfs_quota_us → 100000# 内存控制文件
/sys/fs/cgroup/memory/kubepods/burstable/pod-xxx/memory.limit_in_bytes → 536870912

4.1.4.6. 监控与调试

4.1.4.6.1 查看当前限制

# CPU 配额使用率
cat /sys/fs/cgroup/cpu/.../cpu.stat | grep nr_throttled# 内存使用量
cat /sys/fs/cgroup/memory/.../memory.usage_in_bytes

4.1.4.6.2 性能问题排查

CPU Throttling：检查 cpu.stat 中的 nr_throttled 计数
OOM 事件：通过 dmesg | grep oom_kill 查看被杀容器
实时监控：kubectl top pod 结合 Prometheus 指标

4.2.LimitRange资源

为了自动化管理资源设置，提供了LimitRange资源，能够做一些校验+默认值配置，但是资源配置需求多样，LimitRange能提供的能力有限，所以实际生产很少使用

4.2.1.LimitRange定位

LimitRange 是 Kubernetes 中用于 命名空间级资源管控 的策略对象，主要用于限制 Pod、容器或 PersistentVolumeClaim 的资源分配范围，并自动注入默认配置。

4.2.2.LimitRange核心功能

资源范围限制

限制 Pod/Container 的 CPU/内存 最小请求值（min）和 最大限制值（max）

默认值注入

为未指定 requests/limits 的容器自动设置 默认请求值（defaultRequest）和 默认限制值（default）

存储限制

控制 PersistentVolumeClaim 的存储容量范围（storage 字段）

资源比例控制

通过 maxLimitRequestRatio 限制资源 limits 与 requests 的比值

4.2.3.LimitRange Spec 常用字段

字段	类型	描述	示例值
`type`	`string`	限制对象类型（`Pod`/`Container`/`PersistentVolumeClaim`）	`Container`
`default`	`map`	默认资源限制值（`cpu`/`memory`）	`cpu: "500m"`
`defaultRequest`	`map`	默认资源请求值	`memory: "256Mi"`
`min`	`map`	资源请求/限制的最小值	`cpu: "100m"`
`max`	`map`	资源请求/限制的最大值	`memory: "2Gi"`
`maxLimitRequestRatio`	`map`	`limits` 与 `requests` 的最大比值	`cpu: 3`

4.2.4.LimitRange使用示例

apiVersion: v1
kind: LimitRange
metadata:name: example-limitrange
spec:limits:- type: Containerdefault:cpu: "500m"memory: "512Mi"defaultRequest:cpu: "200m"memory: "256Mi"min:cpu: "100m"memory: "128Mi"max:cpu: "2"memory: "2Gi"maxLimitRequestRatio:cpu: 3- type: PersistentVolumeClaimmin:storage: "1Gi"max:storage: "10Gi"

4.2.5.LimitRange的局限性

LimitRange设置默认值实际使用中受限
LimitRange无法区分container的类型：主容器、initContainer，所以设置的默认值会同时设置到initContainer上去，这在使用中不太符合实际，所以限制了LimitRange的实际使用
因此LimitRange一般可用于设置Limit上限，但不太会用default设置

4.3.磁盘资源需求

在这里插入图片描述

临时存储发生在调度完成之后，由node上的kubelet来管理
- 比如一个pod声明了临时存储，如果对临时存储的使用超限，pod会被驱逐，驱逐pod后会清理掉临时写的那些数据，防止对磁盘造成压力影响到系统稳定性。

5.调度器仅关注pod的requests

调度器关注的 pod资源总量== 多个Containers requests资源之和 + 多个initContainers requests最大值

在这里插入图片描述

调度器只关注requests
不同类型容器的requests需求不一样
- 对于 pod 的多个Containers，在运行时是同时运行的，所以资源计算方法，是所有Containers requests之和
- 对于 pod 的多个initContainers，在运行时是串行运行的，所以资源计算方法，是 取initContainers requests的最大值，并不会把所有initContainers requests加起来
提出问题：
- initContainers阶段需要大量资源，init结束，资源不会归还，也不再使用，其实就浪费掉了
- 解决：没有直接的解决办法，应用一般不会主动归还资源，可以看是否可以配置一些HPA、VPA做一些弹性工作，或做一个额外的组件专用于回收资源

6.kube-scheduler代码关键点

在这里插入图片描述

7.常见问题解析

7.1.Predicate、Priority阶段的插件都是顺序执行的吗？

Kubernetes 调度器的 Predicate 插件（在旧版本中称为 Predicates 阶段）并非完全顺序执行，其执行模式取决于调度器版本和具体配置。

7.1.1.旧版本调度器（基于 Predicates/Priorities 架构）

顺序执行

在 Kubernetes v1.15 及更早版本中，Predicates 阶段的规则是顺序执行的。每个 Predicate 规则依次对候选节点进行过滤，只有通过所有规则的节点才能进入下一阶段。例如：
- 先检查 PodFitsResources（资源是否足够）
- 再检查 PodFitsHostPorts（端口是否冲突）
- 最后验证 PodToleratesNodeTaints（污点容忍）

并发处理节点

虽然规则是顺序执行的，但每个 Predicate 规则会对所有节点并发计算（默认开启 16 个 Goroutine）。
例如，当处理 PodFitsResources 时，调度器会同时计算所有节点的 CPU/内存资源是否满足需求。

性能瓶颈

顺序执行规则在节点规模较大时会导致延迟累积，例如若某个规则计算耗时较长，整个调度周期会被拉长。

7.1.2.新版调度框架（Scheduler Framework）

从 Kubernetes v1.16 开始引入的 Scheduler Framework 对 Predicates 进行了重构，将其拆分为 Filter 插件，并支持更灵活的并发机制
默认并行执行
- Filter 插件在调度框架中默认并行执行（部分插件可能因依赖关系需顺序处理）。例如：
  - NodeResourcesFit（资源检查）和 NodeAffinity（节点亲和性）可以同时计算；
  - VolumeBinding（存储卷绑定）和 PodTopologySpread（拓扑分布）可能并行运行。
依赖控制
- 若插件之间存在依赖关系（例如必须先完成资源检查再处理亲和性），可通过插件配置显式声明执行顺序。
性能优化
- 并行执行显著减少调度延迟，尤其在大规模集群中效果明显。例如，1000 节点的集群调度耗时可从旧版的 2-3 秒降至 500 毫秒以内。
顺序执行的例外场景
- 即使在新版本中，部分 Filter 插件仍需顺序执行
  - 资源预检查
    如 NodeResourcesFit（资源充足性）通常需要优先执行，避免在不满足资源条件的节点上浪费计算资源。
  - 存储卷绑定
    VolumeBinding 插件必须等待持久卷（PV）绑定完成后才能进行后续检查。
  - 拓扑分布约束
    PodTopologySpread 需要基于当前已调度 Pod 的分布状态，可能依赖于其他插件的执行结果。

Kubernetes控制平面组件：调度器Scheduler（一）

云原生学习路线导航页（持续更新中） kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控…...

编程日记 2025/8/3 1:54:53

HTTP：十.cookie机制

Cookie概念及类型 HTTP cookie，简称cookie，又称数码存根、“网站／浏览＋魔饼／魔片”等，是浏览网站时由网络服务器创建并由网页浏览器存放在用户计算机或其他设备的小文本文件。Cookie使Web服务器能在用户的设备存储状态信息（如添加到在线商店购物车中的商品）或跟踪用户…...

编程日记 2025/8/3 6:43:39

go语言对http协议的支持

http：无状态协议，是互联网中使用http使用http实现计算机和计算机之间的请求和响应使用纯文本方式发送和接受协议数据，不需要借助专门工具进行分析就知道协议中的数据服务器端的几个概念 Request：用户请求的信息，用…...

编程日记 2025/8/2 16:52:41

Origin将双Y轴柱状图升级为双向分组柱状图

当变量同时存在两个数值时的可视化时，往往会想到用双Y轴柱状图来表达我们的数据。双Y轴柱状图是一种在同一图表中使用左右两个Y轴的可视化形式，常用于展示两组量纲不同或数值范围差异较大的数据。双向分组柱状图是一种结合了双向柱状图和分组柱状图的…...

编程日记 2025/8/3 6:39:13

FileZilla“服务器发回了不可路由的地址，使用服务器地址代替

问题：在宝塔创建的FTP无法使用，提示“服务器回应不可路由的地址。使用服务器地址代替第一种解决办法：由于宝塔把FTP被动模式端口范围设置成了39000-40000，所以只需要把阿里云服务器上相应的端口范围开放即可。第二种解决办法&am…...

编程日记 2025/8/3 1:23:02

Linux中服务器时间同步

简单介绍在 redhat 8 之前，时间同步服务是使用 NTP（网络时间协议）来实现的，在 redhat 8 及之后使用是 NTP 的实现工具 chrony 来实现时间同步。在 redhat 8 及之后，默认情况下已经安装好 chrony 软件并已经开机启…...

编程日记 2025/8/3 6:36:31

gbase8s之线程状态详解（超值）

--mutex wait nsf.0lock 意味着数据库服务器中的一个线程当前正在等待获取名为 nsf.0lock 的互斥锁可能的原因和影响：锁争用 (Lock Contention): 这是最常见的原因。多个线程可能需要频繁访问由 nsf.0lock 保护的共享资源。如果持有锁的线程执行时间过长，或者有太多线…...

编程日记 2025/7/29 1:35:18

Linux学习——Linux进程间通信（IPC）聊天程序实践

Linux学习——Linux进程间通信（IPC）聊天程序实践一、在阿里云服务器上使用talk程序 Linux系统自带的talk命令可以让两个登录用户进行实时文字聊天： 用户A执行：talk usernameB用户B会收到通知，并需要执行&#xff1…...

编程日记 2025/7/31 22:07:45

PCA 降维实战：从原理到电信客户流失数据应用

一、简介在机器学习领域，数据的特征维度往往较高，这不仅会增加计算的复杂度，还可能导致过拟合等问题。主成分分析（Principal Component Analysis，简称 PCA）作为一种经典的降维技术，能够在保留数…...

编程日记 2025/8/3 5:16:54

即插即用模块(1) -MAFM特征融合

(即插即用模块-特征处理部分) 一、(2024) MAFM&MCM 特征融合特征解码 paper：MAGNet: Multi-scale Awareness and Global fusion Network for RGB-D salient object detection 1. 多尺度感知融合模块 (MAFM) 多尺度感知融合模块 (MAFM) 旨在高效融合 RGB 和深度…...

编程日记 2025/7/30 14:34:34

Linux学习——TCP

一.TCP编程API 1.socket函数 1.socket函数 include include int socket(int domain,int type,int protocol); 参数 domain AF_INET AF_INET6 AF_UNIX,AF_LOCAL AF_NETLINK AF_PACKET type SOCK_STREAM: 流式…...

编程日记 2025/8/2 20:04:11

Kubernetes控制平面组件：调度器Scheduler（二）

编程日记 2025/8/2 22:32:03

数据通信学习笔记之OSPF其他内容2

OSPF 与 BFD 联动网络上的链路故障或拓扑变化都会导致设备重新进行路由计算，所以缩短路由协议的收敛时间对于提高网络的性能是非常重要的。 OSPF 与 BFD 联动就是将 BFD 和 OSPF 关联起来，一旦与邻居之间的链路出现故障，BFD 对完品以&…...

编程日记 2025/7/30 4:45:36

数据通信学习笔记之OSPF的区域

OSPFArea 用于标识一个 OSPF 的区域区域是从逻辑上将设备划分为不同的组，每个组用区域号 (Area ID)来标识 OSPF 的区域 ID 是一个 32bit 的非负整数，按点分十进制的形式(与 IPV4 地址的格式一样)呈现，例如 Area0.0.0.1。为了简便起见&#…...

编程日记 2025/8/1 14:36:52

渐变线性渐变径向渐变重复渐变使用： background-image: xx 渐变 background-image: linear-gradient(red,yellow,green); 公共代码 .box {width: 300px;height: 200px;border: 1px solid black;float: left;margin-left: 30px;margin-top: 30px;text-align:…...

编程日记 2025/8/2 7:28:42

玩机搞机基本常识-------小米OLED屏幕机型怎么设置为永不休眠_手机不息屏_保持亮屏功能拒绝“烧屏” ？

前面在帮一位粉丝解决小米OLED机型在设置----锁屏下没有永不休眠的问题。在这里，大家要明白为什么有些小米机型有这个设置有的没有的原因。区分OLED 屏幕和 LCD屏幕的不同。从根本上拒绝烧屏问题。 OLED 屏幕的一些优缺点💝💝💝 …...

编程日记 2025/7/31 1:42:48

深拷贝和浅拷贝的区别

浅拷贝： 只复制原对象的基本数据类型字段，拥有相对独立的副本数据，修改时不会影响到原对象的字段值。对于原对象的引用数据类型字段，直接共享原对象字段的引用，修改自己的字段时会同时影响原对象。深拷贝&#xff1a…...

编程日记 2025/8/2 17:17:37

RabbitMQ和Seata冲突吗？Seata与Spring中的事务管理冲突吗

1. GlobalTransactional 和 Transactional 是否冲突？ 答：不冲突，它们可以协同工作，但作用域不同。 Transactional: 这是 Spring 提供的注解，用于管理单个数据源内的本地事务。在你当前的 register 方法中&#xff0c…...

编程日记 2025/7/30 3:56:40

[安全实战]逆向工程核心名词详解

逆向工程核心名词详解一、调试与执行类 1. 断点（Breakpoint） 定义：在代码中设置标记，使程序执行到此处时暂停类型： 普通断点：通过INT3指令实现条件断点：满足特定条件时触发内存断点&#xf…...

编程日记 2025/8/2 18:35:07

用键盘实现控制小球上下移动——java的事件控制

本文分享Java的一个有趣小项目，实现用键盘控制小球的移动涉及java知识点：Swing GUI框架，绘图机制，事件处理，焦点控制 1.编写窗口和面板 (1.)定义面板类 Panel 继承自Java 自带类JPanel (2.)定义窗口类 window 继承…...

编程日记 2025/8/1 20:55:17

AutoSAR从概念到实践系列之MCAL篇(二)——Mcu模块配置及代码详解(上)

欢迎大家学习我的《AutoSAR从概念到实践系列之MCAL篇》系列课程，我是分享人M哥，目前从事车载控制器的软件开发及测试工作。学习过程中如有任何疑问，可底下评论！如果觉得文章内容在工作学习中有帮助到你，麻烦点赞收藏评论+关注走一波！感谢各位的支持！根据上一篇内容中…...

编程日记 2025/7/29 1:35:14

BEVDet: High-Performance Multi-Camera 3D Object Detection in Bird-Eye-View

背景在自动驾驶场景下，以往工作是目标检测任务用图像视角做，语义分割用BEV视角做。本文提出了BEVDet，实现了一个统一的框架，它模块化设计分为图像编码器，视角转换器，BEV编码器以及BEV空间的3D检测头。然而…...

编程日记 2025/7/30 12:47:03

高效获取淘宝实时商品数据：API 接口开发与数据采集实战指南

在电商行业竞争白热化的当下，实时且准确的商品数据是企业制定营销策略、优化产品布局的重要依据。淘宝作为国内头部电商平台，其海量的商品数据蕴含着巨大价值。通过 API 接口高效获取淘宝实时商品数据，成为电商从业者和开发者的必备技能。本文…...

编程日记 2025/7/28 23:31:24

kotlin知识体系(六) : Flow核心概念与与操作符指南

1. Flow基础概念 1.1 冷流（Cold Stream） 冷流是Flow的默认形式，其核心特点如下： • 按需触发：仅在消费者调用 collect 时开始发射数据，且每次收集都会重新执行流的逻辑（类似“单播”&#xff0…...

编程日记 2025/7/28 14:36:23

【CentOs】构建云服务器部署环境

(一) 服务器采购 2 CPU4G 内存40G 系统盘 80G 数据盘 (二) 服务器安全组和端口配置 (三) 磁盘挂载 1 登录 root 2 查看目前磁盘使用情况 df -h 3 查看磁盘挂载情况识别哪些磁盘没挂载 fdisk -l 4 对未挂载磁盘做分区 fdisk /dev/vdb 输入m&#xff0…...

编程日记 2025/8/1 23:49:00

【AI论文】对人工智能生成文本的稳健和细粒度检测

摘要：机器生成内容的理想检测系统应该能够在任何生成器上很好地工作，因为越来越多的高级LLM每天都在出现。现有的系统往往难以准确识别人工智能生成的短文本内容。此外，并非所有文本都完全由人类或LLM创作，因此我们更关注部分案…...

编程日记 2025/7/28 7:36:11

MyFamilyTree：专业家谱族谱制作工具

MyFamilyTree 是一款专业级家谱族谱制作工具，支持 Windows 7 至 11 系统（含服务器版本）‌。该软件以直观的拖拽式操作为核心，支持构建多维家族树结构，并提供丰富的多媒体集成功能，便于用户记录家族成员的生…...

编程日记 2025/7/29 1:34:59

【统计分析120】统计分析120题分享

1-30 判断题数学模型指的是通过抽象、简化现实世界的某些现象，利用数学语言来描述他们的结构和行为，做出一些必要的假设，运用适当的数学工具，得到一个数学结论数学模型：指的是通过抽象、简化现实世界的某些现象&am…...

编程日记 2025/8/1 17:07:44

【Windows10下PP-OCRv4部署指南‌】

Windows10下PP-OCRv4部署指南‌ 一、环境准备‌ 安装Visual Studio 2022‌ 下载并安装 ‌C桌面开发组件‌，确保支持MSVC编译环境‌。配置系统环境变量，确保cl.exe等编译工具可用。 Python环境配置‌ 推荐使用Conda创建虚拟环境： bash Co…...

编程日记 2025/8/2 13:21:19

Matlab PID参数整定和设计

1、内容简介 Matlab 206-PID参数整定和设计可以交流、咨询、答疑 2、内容说明略某流量控制系统整定方法仿真（3） 摘要：本次设计针对一个给定的流量控制系统进行仿真，已经确认该系统为简单控制系统，并且控制策略…...

编程日记 2025/8/2 22:10:54

【Linux系统】Linux基础指令（详解Linux命令行常用指令，每一个指令都有示例演示）

文章目录一、与文件路径相关的指令0.补充知识：路径的认识1.pwd 指令2.cd 指令（含家目录的介绍） 二、创建和删除文件的指令0.补充知识：普通文件和目录文件1.touch 指令（可以修改文件的时间戳）2.mkdir 指令3…...

编程日记 2025/8/1 23:07:43

LLM基础-什么是Token？

LLM基础-什么是Token？ 概述 Token 是大语言模型（LLM, Large Language Model）中最基本的输入单元，它是语言被模型“理解”的方式。不同于人类可以直接看懂一段自然语言文本，LLM 只能处理数字，而这些数字就…...

编程日记 2025/8/3 4:52:08

Few-shot medical image segmentation with high-fidelity prototypes 论文总结

题目：Few-shot medical image segmentation with high-fidelity prototypes（高精确原型） 论文：Few-shot medical image segmentation with high-fidelity prototypes - ScienceDirect 源码：https://github.com/tntek/D…...

编程日记 2025/8/1 21:53:54

大模型之路（day 1）

这段时间以来，全身心的投入了研究大模型，虽然还是入门，但比之前已经好了非常多了，不得不说，计算机的学习特别需要强大的自驱力和耐心，以及检索能力。知乎确实在这些知识的分享上做的比csdn好太多了万事开…...

编程日记 2025/7/31 20:06:44

996引擎-拓展变量：物品变量

996引擎-拓展变量：物品变量测试代码参考资料对于Lua来说，只有能保存数据库的变量才有意义。至于临时变量，不像TXT那么束手束脚，通常使用Lua变量就能完成。测试代码 -- 存：物品拓展strfunction (player)local where =...

编程日记 2025/7/29 1:34:39

集合框架（重点）

1. 什么是集合框架 List有序插入对象，对象可重复 Set无序插入对象，对象不可重复（重复对象插入只会算一个） Map无序插入键值对象，键只唯一，值可多样 （这里的有序无序指的是下标，可…...

编程日记 2025/7/31 22:38:34

IDEA在Git提交时添加.ignore忽略文件，解决为什么Git中有时候使用.gitignore也无法忽略一些文件

文章目录一、为什么需要.gitignore文件？二、如何在IntelliJ IDEA中高效管理.gitignore文件？1:先下载这个.ignore插件2. 创建或编辑.gitignore文件3. 使用IDEA内置模板快速生成忽略规则4. 实时预览忽略效果5. 检查忽略规则是否生效6.但是一般我们更多时候…...

编程日记 2025/7/31 9:31:16

如何将自己封装的组件发布到npm上：详细教程

如何将自己封装的组件发布到npm上：详细教程作为前端开发者，我们经常从npm（Node Package Manager）上下载并使用各种第三方库和组件。然而，有时候我们可能会发现自己需要的功能在npm上并不存在，或者我们希望…...

编程日记 2025/8/1 6:38:41

位运算，状态压缩dp（算法竞赛进阶指南学习笔记）

目录移位运算一些位运算的操作最短 Hamilton 路径（状态压缩dp模板，位运算） 0x是十六进制常数的开头；本身是声明进制，后面是对应具体的数； 数组初始化最大值时用0x3f赋值； 移位运算左移把二…...

编程日记 2025/7/30 3:31:54

node.js|环境部署|源码编译高版本的node.js

一、前言本文就如何二进制部署和源码编译安装部署node.js环境做一个简单的介绍 node的版本大体是以18版本为界限，也就是说18版本之前对glibc版本没有要求，其后的版本都对glibc版本有要求，node的版本越高，glibc需要的版本也越…...

编程日记 2025/7/31 20:34:51

通信安全员ABC证的考试内容包括哪些？

通信安全员 ABC 证的考试内容整体上围绕通信安全相关的法律法规、安全技术、安全管理等方面展开，但在具体侧重点上有所不同，以下是详细介绍： 通信安全基础知识通信原理：包含模拟通信和数字通信的基本原理，如调制、解…...

编程日记 2025/8/2 13:38:54

Oracle--SQL基本语法

前言：本博客仅作记录学习使用，部分图片出自网络，如有侵犯您的权益，请联系删除 1、SQL语句介绍在Oracle开发中，客户端把SQL语句发送给服务器，服务器对SQL语句进行编译、执行，把执行的结果返回给…...

编程日记 2025/7/29 1:34:22

windows服务器及网络：论如何安装（虚拟机）

今天我要介绍的是：在Windows中对于安装系统（虚拟机的步骤以及相关的安装事宜），事不宜迟，让我们来看看系统安装（虚拟机）是怎么操作的： 对现在来说，安装电脑系统已经是非常…...

编程日记 2025/7/30 10:21:44

【网络篇】从零写UDP客户端/服务器：回显程序源码解析

大家好呀我是浪前今天讲解的是网络篇的第四章：从零写UDP客户端/服务器：回显程序源码解析从零写UDP客户端/服务器：回显程序源码解析 UDP 协议特性核心类介绍 UDP的socket应该如何使用：1: DatagramSocket2: DatagramPacket回…...

编程日记 2025/7/30 4:37:32

学习笔记：黑马程序员JavaWeb开发教程(2025.3.23)

11.2 案例-文件上传-简介文件上传的前端页面的代码需要放到springboot项目的static里面，也就是resource文件夹下面的static文件夹里面服务端接收前端上传的数据，再服务端定义一个controller来接收数据，再controller中定义一个…...

编程日记 2025/7/29 1:34:14

提示词构成要素对大语言模型跨模态内容生成质量的影响

提示词构成要素对大语言模型跨模态内容生成质量的影响提示词清晰度、具象性与质量正相关限定指向性要素优于引导指向性要素大语言模型生成内容保真度偏差以讯飞星火大模型为实验平台，选取100名具备技术素养的人员，从提示词分类、构成要素和实践原则归纳出7种提示词组…...

编程日记 2025/7/29 1:34:12

浅聊docker的联合文件系统

前言： 在我们pull镜像的时候，就会发现一个神奇的地方，在将镜像pull到本地的时候它是分层下载的，如下图: 这时候我就有一个疑问，为什么是分层下载的？怎么和我们平时下载软件的时候不一样呢？ 联…...

编程日记 2025/8/1 15:20:56

计算机视觉cv入门之Haarcascade的基本使用方法(人脸识别为例)

Haar CascadeXML特征分类器，是一种基于机器学习的方法，它利用了积分图像(或总面积)的概念有效地提取特征(例如，边缘、线条等)的数值。“级联分类器”即意味着不是一次就为图像中的许多特征应用数百个分类器，而是一对一地应用分类器…...

编程日记 2025/7/31 15:23:44

【NLP 62、实践 ⑮、基于RAG + 智谱语言模型的Dota2英雄故事与技能介绍系统】

羁绊由我而起，痛苦也由我承担 —— 25.4.14 英雄介绍文件： 通过网盘分享的文件：RAG 智谱语言模型的Dota2英雄故事与技能介绍系统链接: https://pan.baidu.com/s/1G7Xo5TRvFl2BzUnE0NFaBA?pwd4d4j 提取码: 4d4j --来自百度网盘超级会员v3的…...

编程日记 2025/7/29 1:34:05

Keil MDK 编译问题：function “HAL_IncTick“ declared implicitly

问题与处理策略问题描述 ..\..\User\stm32f1xx_it.c(141): warning: #223-D: function "HAL_IncTick" declared implicitlyHAL_IncTick(); ..\..\User\stm32f1xx_it.c: 1 warning, 0 errors问题原因在 stm32f1xx_it.c 文件中调用了 HAL_IncTick()，但…...

编程日记 2025/7/29 1:34:02

1.kube-scheduler基础

1.1.kube-scheduler介绍

1.1.1.scheduler是什么

1.1.2.调度器如何标记pod该调度到哪个节点？

1.1.3.scheduler本质也是一个生产者-消费者模型

1.1.4.调度需要考虑什么因素

1.2.kube-scheduler核心原理

1.3.与其他调度系统的对比

2.kube-scheduler调度计算：Predicate阶段

2.1.Predicates 工作原理

2.2.Predicates 常见 Plugins

2.2.1.PodFitsHostPorts

2.2.2.PodFitsPorts

2.2.3.PodFitsResources

2.2.4. HostName

2.2.5. MatchNodeSelector

2.2.6. NoVolumeZoneConflict

2.2.7.MatchInterPodAffinity

2.2.8.NoDiskConflict

2.2.9.PodToleratesNodeTaints

2.2.10.CheckNodeMemoryPressure

2.2.11.CheckNodeDiskPressure

2.2.12.NoVolumeNodeConflict

3.kube-scheduler调度计算：Priority 阶段

3.1.Priority工作原理

3.2.Priority 常见Plugins

3.2.1.SelectorSpreadPriority

3.2.2.InterPodAffinityPriority

3.2.3.LeastRequestedPriority

3.2.4.BalancedResourceAllocation

3.2.5.NodePreferAvoidPodsPriority

3.1.6.调度权重对比

4.Pod资源配置底层原理

4.1.Pod的 三种服务质量Qos

4.1.1.QoS 核心概念

4.1.2.QoS 分类规则

4.1.2.1.Guaranteed 有保证的（最高优先级）

4.1.2.2.Burstable 可超售的（中优先级）

4.1.2.3.BestEffort 尽力而为的（最低优先级）

4.1.3.QoS 对资源管理的具体影响

4.1.3.1.调度与资源分配

4.1.3.2.不同QoS适用业务

4.1.4.Pod资源限制的生效原理：cgroups

4.1.4.1.核心机制概述

4.1.4.2.CPU 资源实现细节

4.1.4.2.1.前置知识：CPU 的m是什么单位

4.1.4.2.2.CPU Requests 映射

4.1.4.2.2.CPU Limits 映射

4.1.4.3. 内存资源实现细节

4.1.4.3.1 内存 Limits 映射

4.1.4.3.2 内存软限制（特殊场景）

4.1.4.4. 多级 cgroups 控制

4.1.4.5. 完整配置示例

4.1.4.5.1 Pod 定义

4.1.4.5.2 生成的 cgroups 配置

4.1.4.6. 监控与调试

4.1.4.6.1 查看当前限制

4.1.4.6.2 性能问题排查

4.2.LimitRange资源

4.2.1.LimitRange定位

4.2.2.LimitRange核心功能

4.2.3.LimitRange Spec 常用字段

4.2.4.LimitRange使用示例

4.2.5.LimitRange的局限性

4.3.磁盘资源需求

5.调度器仅关注pod的requests

6.kube-scheduler代码关键点

7.常见问题解析

7.1.Predicate、Priority阶段的插件都是顺序执行的吗？

7.1.1.旧版本调度器（基于 Predicates/Priorities 架构）

7.1.2.新版调度框架（Scheduler Framework）

相关文章：

4.1.Pod的三种服务质量Qos