Adam 优化器与动量法:二阶矩与 ODE 的联系
Adam 优化器与动量法:二阶矩与 ODE 的联系
作为深度学习研究者,你一定对 Adam(Adaptive Moment Estimation)优化器非常熟悉。它因自适应学习率和高效率而成为训练神经网络的标配算法。Adam 使用了一阶动量(梯度的指数移动平均)和二阶动量(梯度平方的指数移动平均),这让人不禁联想到动量法:Adam 是不是动量法的一种变种?它也能用 ODE(普通微分方程)来描述吗?本篇博客将以直观的语言,面向深度学习研究者,探讨 Adam 与动量法的关系,以及如何从连续视角用 ODE 理解 Adam。
Adam 优化器:核心机制
先回顾 Adam 的更新规则。给定目标函数 ( f ( x ) f(x) f(x) ),Adam 的迭代步骤如下:
- 计算梯度:
g t = ∇ f ( x t ) g_t = \nabla f(x_t) gt=∇f(xt) - 更新一阶动量(均值):
m t = β 1 m t − 1 + ( 1 − β 1 ) g t m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t mt=β1mt−1+(1−β1)gt - 更新二阶动量(未中心化的方差):
v t = β 2 v t − 1 + ( 1 − β 2 ) g t 2 v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 vt=β2vt−1+(1−β2)gt2 - 偏差校正:
m ^ t = m t 1 − β 1 t , v ^ t = v t 1 − β 2 t \hat{m}_t = \frac{m_t}{1 - \beta_1^t}, \quad \hat{v}_t = \frac{v_t}{1 - \beta_2^t} m^t=1−β1tmt,v^t=1−β2tvt - 参数更新:
x t + 1 = x t − η m ^ t v ^ t + ϵ x_{t+1} = x_t - \eta \frac{\hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon} xt+1=xt−ηv^t+ϵm^t
- ( β 1 \beta_1 β1 )(如 0.9):一阶动量的衰减率。
- ( β 2 \beta_2 β2 )(如 0.999):二阶动量的衰减率。
- ( η \eta η ):学习率。
- ( ϵ \epsilon ϵ ):小常数,防止除零。
Adam 的“动量”体现在 ( m t m_t mt )(类似动量法的速度)和 ( v t v_t vt)(自适应调整步长),但它与传统动量法有显著区别。
Adam 是动量法吗?
相似之处
- 一阶动量:( m t m_t mt ) 是梯度的指数移动平均,类似于动量法(可以参考笔者的另一篇博客:动量法与带阻尼的二阶 ODE:从离散优化到连续动态的奇妙联系)中的 ( v t = γ v t − 1 − η ∇ f ( x t ) v_t = \gamma v_{t-1} - \eta \nabla f(x_t) vt=γvt−1−η∇f(xt) )。两者都利用历史梯度平滑更新方向。
- 加速效果:Adam 和动量法都能加速收敛,尤其在平坦区域或梯度噪声大的情况下。
不同之处
- 二阶动量:动量法没有 ( v t v_t vt ) 这样的二阶矩。Adam 的 ( v t v_t vt ) 估计梯度的未中心化方差,用于自适应调整学习率(( η v ^ t + ϵ \frac{\eta}{\sqrt{\hat{v}_t} + \epsilon} v^t+ϵη)),而动量法只依赖固定学习率。
- 更新规则:动量法直接用速度 ( v t v_t vt ) 更新参数,Adam 则将 ( m t m_t mt ) 除以 ( v t \sqrt{v_t} vt ),引入了尺度自适应性。
- 物理类比:动量法像带阻尼的小球滚动,Adam 更像一个“智能小球”,根据路径的“颠簸程度”(梯度方差)动态调整步伐。
结论:Adam 可以看作是动量法的扩展,但严格来说不是传统动量法。它融合了动量法(一阶)和 RMSProp(二阶)的思想,是一种更复杂的自适应优化算法。
Adam 能用 ODE 描述吗?
动量法可以用带阻尼的二阶 ODE 表示:
d 2 x d t 2 + μ d x d t + β ∇ f ( x ) = 0 \frac{d^2 x}{dt^2} + \mu \frac{dx}{dt} + \beta \nabla f(x) = 0 dt2d2x+μdtdx+β∇f(x)=0
Adam 引入了二阶动量,它也能用 ODE 表示吗?答案是肯定的,但会比动量法复杂一些,因为 Adam 的动态涉及两个辅助变量(( m m m ) 和 ( v v v ))的耦合演化。
从离散到连续的推导
假设时间步长为 ( Δ t \Delta t Δt),将 Adam 的更新看作连续过程:
-
一阶动量 ( m t m_t mt ):
m t = β 1 m t − 1 + ( 1 − β 1 ) g t m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t mt=β1mt−1+(1−β1)gt
两边减去 ( m t − 1 m_{t-1} mt−1 ) 并除以 ( Δ t \Delta t Δt):
m t − m t − 1 Δ t = ( β 1 − 1 ) m t − 1 + ( 1 − β 1 ) g t Δ t \frac{m_t - m_{t-1}}{\Delta t} = \frac{(\beta_1 - 1) m_{t-1} + (1 - \beta_1) g_t}{\Delta t} Δtmt−mt−1=Δt(β1−1)mt−1+(1−β1)gt
令 ( μ 1 = 1 − β 1 Δ t \mu_1 = \frac{1 - \beta_1}{\Delta t} μ1=Δt1−β1),当 ( Δ t → 0 \Delta t \to 0 Δt→0):
d m d t = − μ 1 m + μ 1 ∇ f ( x ) \frac{dm}{dt} = -\mu_1 m + \mu_1 \nabla f(x) dtdm=−μ1m+μ1∇f(x)
这是一个一阶 ODE,描述 ( m ( t ) m(t) m(t) ) 随时间趋向梯度的指数加权平均。 -
二阶动量 ( v t v_t vt ):
v t = β 2 v t − 1 + ( 1 − β 2 ) g t 2 v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 vt=β2vt−1+(1−β2)gt2
类似地,令 ( μ 2 = 1 − β 2 Δ t \mu_2 = \frac{1 - \beta_2}{\Delta t} μ2=Δt1−β2):
d v d t = − μ 2 v + μ 2 ∇ f ( x ) 2 \frac{dv}{dt} = -\mu_2 v + \mu_2 \nabla f(x)^2 dtdv=−μ2v+μ2∇f(x)2
这是另一个一阶 ODE,描述 ( v ( t ) v(t) v(t) ) 趋向梯度平方的加权平均。 -
参数更新 ( x t x_t xt ):
x t + 1 = x t − η m ^ t v ^ t + ϵ x_{t+1} = x_t - \eta \frac{\hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon} xt+1=xt−ηv^t+ϵm^t
忽略偏差校正(假设 ( t t t ) 较大,( β 1 t , β 2 t → 0 \beta_1^t, \beta_2^t \to 0 β1t,β2t→0)),近似为:
x t + 1 − x t Δ t = − η m t v t + ϵ \frac{x_{t+1} - x_t}{\Delta t} = -\eta \frac{m_t}{\sqrt{v_t} + \epsilon} Δtxt+1−xt=−ηvt+ϵmt
当 ( Δ t → 0 \Delta t \to 0 Δt→0):
d x d t = − η m v + ϵ \frac{dx}{dt} = -\eta \frac{m}{\sqrt{v} + \epsilon} dtdx=−ηv+ϵm
Adam 的 ODE 系统
综合上述,Adam 对应一个耦合的 ODE 系统:
d x d t = − η m v + ϵ \frac{dx}{dt} = -\eta \frac{m}{\sqrt{v} + \epsilon} dtdx=−ηv+ϵm
d m d t = − μ 1 m + μ 1 ∇ f ( x ) \frac{dm}{dt} = -\mu_1 m + \mu_1 \nabla f(x) dtdm=−μ1m+μ1∇f(x)
d v d t = − μ 2 v + μ 2 ∇ f ( x ) 2 \frac{dv}{dt} = -\mu_2 v + \mu_2 \nabla f(x)^2 dtdv=−μ2v+μ2∇f(x)2
- ( x ( t ) x(t) x(t) ):参数随时间的轨迹。
- ( m ( t ) m(t) m(t) ):一阶动量的连续演化。
- ( v ( t ) v(t) v(t) ):二阶动量的连续演化。
是否二阶 ODE?
- 动量法:通过 ( v = d x d t v = \frac{dx}{dt} v=dtdx ) 消去速度,得到二阶 ODE。
- Adam:( m m m ) 和 ( v v v ) 是独立的动态变量,无法直接消去为一阶导数,因此是三个一阶 ODE 的系统,而非单个二阶 ODE。但从物理意义上,它仍有“加速度”的影子,因为 ( m m m ) 和 ( v v v ) 的变化影响 ( x x x ) 的更新速率。
物理类比与直观理解
- 动量法:像一个小球受阻尼和梯度力推动。
- Adam:像一个“自适应小球”,不仅有速度(( m m m )),还根据路径“颠簸”(( v v v ))调整步伐。( v \sqrt{v} v ) 像一个动态摩擦系数,让小球在梯度大的地方慢行,在平坦处快走。
当 ( t → ∞ t \to \infty t→∞ ):
- ( d m d t → 0 \frac{dm}{dt} \to 0 dtdm→0 ),则 ( m → ∇ f ( x ) m \to \nabla f(x) m→∇f(x) )。
- ( d v d t → 0 \frac{dv}{dt} \to 0 dtdv→0 ),则 ( v → ∇ f ( x ) 2 v \to \nabla f(x)^2 v→∇f(x)2 )。
- ( d x d t → 0 \frac{dx}{dt} \to 0 dtdx→0 ),则 ( ∇ f ( x ) → 0 \nabla f(x) \to 0 ∇f(x)→0 ),( x x x ) 收敛到最优解。
与深度学习的联系
- 自适应性:( v v v ) 的引入让 Adam 比动量法更灵活,尤其在深度网络的高维、噪声梯度中表现优异。
- ODE 视角:Adam 的连续形式揭示了其动态平衡过程,与扩散模型中的概率流 ODE 有类似的多变量耦合特性。
总结
Adam 优化器虽然不是传统动量法,但通过一阶动量 ( m ) 和二阶动量 ( v v v )继承并扩展了动量的思想。它的离散更新可以转化为一个三变量 ODE 系统:
d x d t = − η m v + ϵ , d m d t = − μ 1 m + μ 1 ∇ f ( x ) , d v d t = − μ 2 v + μ 2 ∇ f ( x ) 2 \frac{dx}{dt} = -\eta \frac{m}{\sqrt{v} + \epsilon}, \quad \frac{dm}{dt} = -\mu_1 m + \mu_1 \nabla f(x), \quad \frac{dv}{dt} = -\mu_2 v + \mu_2 \nabla f(x)^2 dtdx=−ηv+ϵm,dtdm=−μ1m+μ1∇f(x),dtdv=−μ2v+μ2∇f(x)2
这不是二阶 ODE,而是耦合的一阶系统,体现了自适应优化的复杂动态。对于深度学习研究者来说,这种 ODE 视角不仅加深了对 Adam 的理解,还为探索连续优化方法提供了灵感。
注:推导简化了偏差校正的影响,实际 ODE 可能更复杂,但核心思想一致。
后记
2025年3月8日19点46分于上海,在Grok3大模型辅助下完成。
相关文章:
Adam 优化器与动量法:二阶矩与 ODE 的联系
Adam 优化器与动量法:二阶矩与 ODE 的联系 作为深度学习研究者,你一定对 Adam(Adaptive Moment Estimation)优化器非常熟悉。它因自适应学习率和高效率而成为训练神经网络的标配算法。Adam 使用了一阶动量(梯度的指数…...
嵌入式学习第二十三天--网络及TCP
进程通信的方式: 同一主机 传统 system V 不同主机 网络 --- 解决不同主机间 的进程间通信 网络 (通信) //1.物理层面 --- 联通(通路) //卫星 2G 3G 4G 5G 星链 (千帆) //2.逻辑层面 --- 通路(软件) MAC os LINUX …...
前端表单提交与后端处理全解析:从HTML到Axios与SpringBoot实战
前端表单提交与后端处理全解析:从HTML到Axios与SpringBoot实战 一、GET与POST请求的两种面孔 1. HTML表单基础实现 <!-- GET请求示例:搜索表单 --> <form action="/api/search" method="GET"><input type="text" name="…...
python django orm websocket html 实现deepseek持续聊天对话页面
最终效果: 技术栈: python django orm websocket html 项目结构: 这里只展示关键代码: File: consumers.py # -*- coding:utf-8 -*- # Author: 喵酱 # time: 2025 - 03 -02 # File: consumers.py # desc: import json from asg…...
大白话html语义化标签优势与应用场景
大白话html语义化标签优势与应用场景 大白话解释 语义化标签就是那些名字能让人一看就大概知道它是用来做什么的标签。以前我们经常用<div>来做各种布局,但是<div>本身没有什么实际的含义,就像一个没有名字的盒子。而语义化标签就像是有名…...
考研英语语法全攻略:从基础到长难句剖析
引言 在考研英语的备考之旅中,语法犹如一座灯塔,为我们在浩瀚的英语知识海洋中指引方向。无论是阅读理解中复杂长难句的解读,还是写作时准确流畅表达的需求,扎实的语法基础都起着至关重要的作用。本文将结合有道考研语法基础入门课的相关内容,为大家全面梳理考研英语语法…...
Vue3 生命周期
回顾Vue2的生命周期 创建(创建前,创建完毕)beforeCreate、created挂载(挂载前,挂载完毕)beforeMount、mounted更新(更新前,更新完毕)beforeUpdate、updated销毁…...
hbase-05 namespace、数据的确界TTL
要点 掌握HBase的命名空间namespace概念 掌握HBase数据版本确界 掌握HBase数据TTL 1. HBase的namespace 1.1 namespace基本介绍 在HBase中,namespace命名空间指对一组表的逻辑分组,类似RDBMS中的database,方便对表在业务上划分。Apache…...
线程的常见使用方法
Java中的线程并不是真正意义的线程,我们使用的是Thread类来表示线程,而这个类是 JVM 用来管理线程的一个类,也就是说,每个线程都有一个唯一的 Thread对象 与之关联 每一个执行流都需要有一个对象来进行描述,那么一个Thread对象就是用来表述一个线程执行流的,JVM会将这些对象统…...
架构师面试(十一):消息收发
问题 IM 是互联网中非常典型的独立的系统,麻雀虽小但五脏俱全,非常值得深入研究和探讨,继上次IM相关题目之后,我们继续讨论IM相关话题。 关于IM系统【消息收发模型】的相关描述,下面说法错误的有哪几项? …...
MoonSharp 文档一
目录 1.Getting Started 步骤1:在 IDE 中引入 MoonSharp 步骤2:引入命名空间 步骤3:调用脚本 步骤4:运行代码 2.Keeping a Script around 步骤1:复现前教程所有操作 步骤2:改为创建Script对象 步骤…...
【linux网络编程】端口
一、端口(Port)概述 在计算机网络中,端口(Port) 是用来标识不同进程或服务的逻辑通信端点。它类似于一座大楼的房间号,帮助操作系统和网络协议区分不同的应用程序,以便正确地传输数据。 1. 端口…...
Vulnhub-Node
目录标题 一、靶机搭建二、信息收集靶机信息扫ip扫开放端口和版本服务信息指纹探测目录扫描 三、Web渗透信息收集zip爆破ssh连接 四、提权内核版本提权 利用信息收集拿到路径得到账户密码,下载备份文件,base64解密后,利用fcrackzip爆破zip压缩…...
RK3568平台(camera篇)camera3_profiles_rk3588.xml解析
camera3_profiles_rk3588.xml 是一个与 Android 相机 HAL(硬件抽象层)相关的配置文件,通常用于定义 Rockchip RK3588 平台上的相机设备及其功能。该文件基于 Android 的 Camera3 HAL 框架,用于描述相机的配置、流配置、分辨率、帧率、格式等信息。 以下是对 camera3_profi…...
高阶哈希算法
SHA-256简介 SHA-256 是 **SHA-2(Secure Hash Algorithm 2)**家族中的一种哈希算法,由美国国家安全局设计,并于 2001 年发布。它能够将任意长度的数据映射为一个固定长度256 位,即 32 字节的哈希值,通常以…...
Spark数据倾斜深度解析与实战解决方案
Spark数据倾斜深度解析与实战解决方案 一、数据倾斜的本质与影响 数据倾斜是分布式计算中因数据分布不均导致的性能瓶颈现象。当某些Key对应的数据量远超其他Key时,这些"热点Key"所在的Task会消耗80%以上的计算时间,成为整个作业的木桶短板。具体表现为: Task执…...
Kubernetes滚动更新实践
前言 在我之前的项目中,对微服务升级采用的做法是删除整个namespace, 再重新应用所有yaml。 这种方式简单粗暴,但是不可避免的导致服务中断,影响了用户体验 为了解决更新服务导致的服务中断问题, Kubernetes提供了一种…...
Broken pipe
比较常见的一个问题。 但是并不是每个人都能说清楚。 首先注意下写法: Broken pipe # B大写 p小写 主要是grep的时候别写错了 常见的原因 1、客户端关闭连接。 在服务器端处理请求的过程中,客户端突然关闭了连接,例如浏览器关闭、网络断开…...
doris:ClickHouse
Doris JDBC Catalog 支持通过标准 JDBC 接口连接 ClickHouse 数据库。本文档介绍如何配置 ClickHouse 数据库连接。 使用须知 要连接到 ClickHouse 数据库,您需要 ClickHouse 23.x 或更高版本 (低于此版本未经充分测试)。 ClickHouse 数据库的 JDBC 驱动程序&a…...
前K个高频单词
692. 前K个高频单词 - 力扣(LeetCode) 题目描述: 给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。 返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序…...
恢复IDEA的Load Maven Changes按钮
写代码的时候不知道点到什么东西了,pom文件上的这个弹窗就是不出来了,重启IDEA,reset windos都没用,网上搜也没收到解决方案 然后开打开其他项目窗口时,看到那个的功能名叫 Hide This Notification 于是跑到Setting里…...
【五.LangChain技术与应用】【31.LangChain ReAct Agent:反应式智能代理的实现】
一、ReAct Agent是啥?为什么说它比「普通AI」聪明? 想象一下,你让ChatGPT查快递物流,它可能直接编个假单号糊弄你。但换成ReAct Agent,它会先推理(Reasoning)需要调用哪个接口,再行动(Action)查询真实数据——这就是ReAct的核心:让AI学会「动脑子」再动手。 举个真…...
Leetcode 62: 不同路径
Leetcode 62: 不同路径 问题描述: 一个机器人位于一个 (m \times n) 网格的左上角(起始点位于 ((0, 0)))。 机器人每次只能向下或向右移动一步。网格的右下角为终点(位于 ((m-1, n-1)))。 计算机器人从左上角到右下角…...
计算机毕业设计SpringBoot+Vue.js火锅店管理系统(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
Docker Desktop 4.38 安装与配置全流程指南(Windows平台)
一、软件定位与特性 Docker Desktop 是容器化应用开发与部署的一体化工具,支持在本地环境创建、管理和运行Docker容器。4.38版本新增GPU加速支持、WSL 2性能优化和Kubernetes 1.28集群管理功能,适用于微服务开发、CI/CD流水线搭建等场景。 二、安装环境…...
算法系列之广度优先搜索解决妖怪和尚过河问题
在算法学习中,广度优先搜索(BFS)是一种常用的图搜索算法,适用于解决最短路径问题、状态转换问题等。本文将介绍如何利用广度优先搜索解决经典的“妖怪和尚过河问题”。 问题描述 有三个妖怪和三个和尚需要过河。他们只有一条小船…...
【技术白皮书】内功心法 | 第一部分 | IP协议的目的与工作原理(IP地址)
目录 IP协议的介绍IP协议的目的与工作原理IP协议处理过程与信件传递的相似IP协议处理过程与信件传递的区别IP协议中的概念IP数据包IP地址IP地址组成IP地址分类和组成A、B、C三类地址的格式设计特殊类型的IP地址与传统通信地址进行类比IP地址的表示五类IP地址的地址范围IP地址的…...
【Linux】外接硬盘管理
查看外接硬盘信息 连接外接硬盘后,使用以下命令识别设备: lsblk:列出块设备及其挂载点 lsblk示例输出可能显示设备名称如 /dev/sdb。 通过 lsblk -f 可同时显示文件系统类型和 UUID。 fdisk -l:列出所有磁盘的分区信息ÿ…...
【Hadoop】详解Zookeeper选主流程
1. ZooKeeper 的工作原理 Zookeeper 的核心是Zab协议。Zab协议有两种模式,它们分别是恢复模式(选主)和广播模式(同步)。 为了保证事务的顺序一致性,Zookeeper采用了递增的事务id号(zxid)来标识事务。所有…...
C语言-语法
数据类型 字符串 C中字符串拼接不用+号,直接使用空格。 char* str = "hello" "world"; 换行链接,加上\就不会报错 char* longStr = "00000000000000000000000000000\ 00000000000000000000000000000"; typedef C 语言提供了 typedef …...
Flink Forward Asia 2024 大会 内容整理
一、Flink 2.0:十年磨一剑,开启流计算新纪元 作为 Flink 诞生十周年的重磅更新,Flink 2.0 被定位为“面向未来十年的流计算引擎”,核心目标是解决云原生、AI 融合、存算效率等新时代挑战。以下是它的几大杀手锏: 1. …...
golang进阶知识专项-理解值传递
在 Go 语言中,所有函数的参数传递都是值传递(Pass by Value)。当你将一个变量作为参数传递给函数时,实际上传递的是该变量的副本,而不是变量本身。理解这一点对于避免常见的编程错误至关重要。根据不同的类型ÿ…...
2020年联考《申论》第三题(河北县级卷)
材料: 总面积不过八平方米的店铺,摆满货品之后,两人在店内走动都有些困难,但这家小店在当地却是小有名气的老字号。69岁的店主老林是资深木雕艺人,更被称为“最后的手工酸枝筷子传人”。手工木筷取材自缅甸坤甸木、老挝…...
Kali WebDAV 客户端工具——Cadaver 与 Davtest
1. 工具简介 在 WebDAV 服务器管理和安全测试过程中,Cadaver 和 Davtest 是两款常用的命令行工具。 Cadaver 是一个 Unix/Linux 命令行 WebDAV 客户端,主要用于远程文件管理,支持文件上传、下载、移动、复制、删除等操作。Davtest 则是一款…...
八点八数字科技:开启数字人应用的无限可能
在数字科技飞速发展的时代,八点八数字科技凭借卓越实力,成为行业的领军者。自 2014 年成立,公司汇聚近百位顶尖人才,手握 30 新型发明专利与 80 软件著作权,完成数千万融资,实力备受认可。其自主研发的全…...
Vue 使用 vue-router 时,多级嵌套路由缓存问题处理
Vue 使用 vue-router 时,多级嵌套路由缓存问题处理 对于三级菜单(或多级嵌套路由),vue 都是 通过 keep-alive 组件来实现路由组件的缓存。 有时候三级或者多级路由时,会出现失效情况。以下是三级菜单缓存的例子。 最…...
《实战AI智能体》Deepseek可以做什么?自然语言理解与分析
在人工智能技术快速迭代的今天,Deepseek凭借其先进的自然语言处理能力,正在重塑人机交互的边界。本文将从技术实现维度,深入解析该平台在自然语言理解、知识推理与文本分类三大核心领域的技术突破与应用实践。 一、深度语义理解引擎 Deepseek构建了多层级的语义解析架构,实…...
虚拟主机认证功能
一.认证功能 类型: 1.基于客户端地址的认证 2.基于用户的认证 1.基于客户端地址的认证 nginx是一款模块化软件,功能都是基于模块实现的。 如上图所示,访问认证是使用的这个access_module模块。 这个模块也给我们提供了一些指令…...
BGP协议深度解析:从背景到术语的全面梳理
引言 在复杂的网络架构中,不同自治系统(AS)之间的路由交互至关重要。BGP(Border Gateway Protocol,边界网关协议)作为自治系统间的动态路由协议,承担着跨 AS 路由传递的关键任务。本文将深入探讨…...
初步认识线程
概念 一个线程就是一个 "执行流",每一个线程之间都可以按照顺序执行自己的代码,多个线程之间可以 "同步" 执行多份代码 比如说,原本一个人做的事情,现在交给三个人一起做,那么这三个人就是线程 使用原因 那么为什么要有线程呢?我们直接使用进程不可以…...
【从零开始学习计算机科学】数字逻辑(一)绪论
【从零开始学习计算机科学】数字逻辑(一)绪论 概论信息与数字数字系统中常用的概念数字信号的描述方法概论 从数字(集成)电路的出现到计算机到网络到今天的移动互联网,数字电路是所有现代信息技术的基础。那么数字电路的基础又是什么呢?就是数字逻辑。所有数字系统都是基…...
Tomcat与Jetty的选择
Tomcat与Jetty的对比分析,分核心区别、性能表现及选型建议三部分: 一、核心区别对比 对比维度TomcatJetty架构设计多层级容器结构(Server→Service→Engine等),复杂度高基于Handler链的轻量级设计,扩展性强…...
用AI学编程2——python学习1
一个py文件,学会所有python所有语法和特性,给出注释,给出这样的文件 Python 学习整合文件 """ Python 学习整合文件 包含 Python 的基础语法、数据结构、函数定义、面向对象编程、异常处理、文件操作、高级特性等内容 每个部…...
【教程】宝塔提示请不要将网站根目录设置到以下关键目录中
【教程】宝塔提示请不要将网站根目录设置到以下关键目录中 【教程】宝塔提示请不要将网站根目录设置到以下关键目录中更换目录解决问题 先在宝塔下载一个 【教程】宝塔提示请不要将网站根目录设置到以下关键目录中更换目录解决问题_起尔网【教程】宝塔提示请不要将网站根目录设…...
html常用的文本标签以及属性
HTML标签 HTML通过一系列的标签(也成为元素),来定义文本,图像,链接等等,HTML标签是由尖括号包围的关键字。 标签通常成对出现,包括开始标签和结束标签(也成为双标签)&a…...
城市霓虹灯夜景拍照后期Lr调色教程,手机滤镜PS+Lightroom预设下载!
调色教程 在城市霓虹灯夜景拍摄中,由于现场光线复杂等因素,照片可能无法完全呈现出当时的视觉感受。通过 Lr 调色,可以弥补拍摄时的不足。例如,运用基本调整面板中的曝光、对比度、阴影等工具,可以处理出画面的整体明暗…...
c#面试题整理
1.如何保持数据库的完整性,一致性 最好的方法:数据库约束(check,unique,主键,外键,默认,非空) 其次是:用触发器 最后:才是自己些业务逻辑,这个效率低 2.事…...
数据库基础以及基本建库建表的简单操作
文章目录 一、数据库是啥1.1、数据库的概念1.1、关系型数据库、非关系型数据库1.1、数据库服务器,数据库与表之间的关系 二、为啥要使用数据库2.1:传统数据文件存储2.2:数据库存储数据2.3、结论 三、使用数据库了会咋样四、应该咋用数据库&am…...
基于spring boot使用@Sl4j的日志功能,注解引入后爆红未生效
🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 问题描述问题分析解决方案 📃文章…...
《深度剖析架构蒸馏与逻辑蒸馏:探寻知识迁移的差异化路径》
在人工智能模型优化的前沿领域,架构蒸馏与逻辑蒸馏作为知识蒸馏的关键分支,正引领着模型小型化与高效化的变革浪潮。随着深度学习模型规模与复杂度的不断攀升,如何在资源受限的情况下,实现模型性能的最大化,成为了学术…...