当前位置：首页 > news >正文

扩散模型（一）

news 来源：原创 2025/8/23 15:46:46

在生成领域，迄今为止有几个主流的模型，分别是 GAN, VAE，Flow 以及 Diffusion 模型。

GAN：GAN 的学习机制是对抗性学习，通过生成器和判别器的对抗博弈来进行学习，这种竞争机制促使生成器不断提升生成能力，以生成更逼真的数据来欺骗判别器，而判别器也不断提高辨别真假数据的能力。
VAE：VAE 的学习机制是隐空间编码与重建解码，学习到的潜在空间具有连续性和可解释性，潜在变量的微小变化通常会导致生成结果在语义上的平滑变化，可以通过对潜在变量的操作来实现对生成结果的某种控制。
Flow：Flow 的学习机制是基于可逆的变换函数构建模型，能够精确地计算数据在不同空间之间的变换，以及相应的概率密度变化，通过一系列可逆变换将简单的先验分布映射到复杂的数据分布。

上面几类模型它们在生成高质量样本方面取得了巨大成功，但每个模型都有其自身的局限性。生成对抗网络（GAN）模型因其对抗训练的特性，存在训练可能不稳定以及生成多样性不足的问题。变分自编码器（VAE）依赖替代损失。流模型（Flow）则必须使用专门的架构来构建可逆变换。

在这里插入图片描述

图 1：GAN, VAE, FLOW, Diffusion 模型

扩散模型的灵感源自非平衡热力学。它们定义了一个扩散步骤的马尔可夫链，用于逐步向数据中缓慢添加随机噪声，然后学习逆转扩散过程，以便从噪声中构建出所需的数据样本。与变分自编码器（VAE）或流模型不同，扩散模型通过固定的流程进行学习，并且其潜在变量具有高维度（与原始数据维度相同）。

Forward diffusion process

给定一个从真实数据分布中采样得到的数据点 $\mathbf{x}_0 \sim q(\mathbf{x})$ ，我们定义一个正向扩散过程。在这个过程中，我们分 $T$ 步向该样本中添加少量高斯噪声，从而生成一系列含噪样本， $\mathbf{x}_1, \dots, \mathbf{x}_T$ ，每一步的步长由方差 $\{\beta_t \in (0, 1)\}_{t=1}^T$ 控制。

$q(\mathbf{x}_t \vert \mathbf{x}_{t-1}) = \mathcal{N}(\mathbf{x}_t; \sqrt{1 - \beta_t} \mathbf{x}_{t-1}, \beta_t\mathbf{I}) \quad q(\mathbf{x}_{1:T} \vert \mathbf{x}_0) = \prod^T_{t=1} q(\mathbf{x}_t \vert \mathbf{x}_{t-1})$

随着采样步数 $t$ 逐渐增加，数据样本 $\mathbf{x}_0$ 会逐渐失去其可辨别的特征，最终当 $\to \infty$ ， $\mathbf{x}_T$ 等同于一个各向同性的高斯分布。
在这里插入图片描述

图 2

上述过程的一个优良特性是，我们可以利用重参数化技巧，以封闭形式在任意时间步 $t$ 对 $\mathbf{x}_t$ 进行采样。设 $\alpha_t = 1 - \beta_t$ 并且 $\bar{\alpha}_t = \prod_{i=1}^t \alpha_i$

$\begin{aligned} \mathbf{x}_t &= \sqrt{\alpha_t}\mathbf{x}_{t-1} + \sqrt{1 - \alpha_t}\boldsymbol{\epsilon}_{t-1} & \text{ ;where } \boldsymbol{\epsilon}_{t-1}, \boldsymbol{\epsilon}_{t-2}, \dots \sim \mathcal{N}(\mathbf{0}, \mathbf{I}) \\ &= \sqrt{\alpha_t \alpha_{t-1}} \mathbf{x}_{t-2} + \sqrt{1 - \alpha_t \alpha_{t-1}} \bar{\boldsymbol{\epsilon}}_{t-2} & \text{ ;where } \bar{\boldsymbol{\epsilon}}_{t-2} \text{ merges two Gaussians (*).} \\ &= \dots \\ &= \sqrt{\bar{\alpha}_t}\mathbf{x}_0 + \sqrt{1 - \bar{\alpha}_t}\boldsymbol{\epsilon} \\ q(\mathbf{x}_t \vert \mathbf{x}_0) &= \mathcal{N}(\mathbf{x}_t; \sqrt{\bar{\alpha}_t} \mathbf{x}_0, (1 - \bar{\alpha}_t)\mathbf{I}) \end{aligned}$

回想一下，当我们合并两个方差不同的高斯分布, $\mathcal{N}(\mathbf{0}, \sigma_1^2\mathbf{I})$ 和 $\mathcal{N}(\mathbf{0}, \sigma_2^2\mathbf{I})$ ，新的分布为 $\mathcal{N}(\mathbf{0}, (\sigma_1^2 + \sigma_2^2)\mathbf{I})$ .合并后的标准差是 $\sqrt{(1 - \alpha_t) + \alpha_t (1-\alpha_{t-1})} = \sqrt{1 - \alpha_t\alpha_{t-1}}$

通常，当样本的噪声更大时，我们可以采用更大的更新步长，, 所以 $\beta_1 < \beta_2 < ... < \beta_T$ 因此 $\bar{\alpha}_1 > ... > \bar{\alpha}_T$

Connection with stochastic gradient Langevin dynamics

朗之万动力学是物理学中的一个概念，用于对分子系统进行统计建模。与随机梯度下降相结合，随机梯度朗之万动力学可以仅利用梯度 $\nabla_\mathbf{x} \log p(\mathbf{x})$ ，通过马尔可夫链更新，从概率密度 $p(\mathbf{x})$ 中生成样本：

$\mathbf{x}_t = \mathbf{x}_{t-1} + \frac{\delta}{2} \nabla_\mathbf{x} \log p(\mathbf{x}_{t-1}) + \sqrt{\delta} \boldsymbol{\epsilon}_t ,\quad\text{where } \boldsymbol{\epsilon}_t \sim \mathcal{N}(\mathbf{0}, \mathbf{I})$

其中 $\delta$ 表示步长. 当 $\to \infty, \epsilon \to 0$ 时, $\mathbf{x}_T$ 等同于真实概率密度 $p(\mathbf{x})$ 。
与标准随机梯度下降相比，随机梯度朗之万动力学在参数更新中注入高斯噪声，以避免陷入局部最小值。

Reverse diffusion process

如果我们能逆转上述过程，并且从 $q(\mathbf{x}_{t-1} \vert \mathbf{x}_t)$ 里进行采样, 我们就能从高斯噪声输入 $\mathbf{x}_T \sim \mathcal{N}(\mathbf{0},\mathbf{I})$ 中重建真实样本，需要注意的是，如果 $\beta_t$ 如果足够小, $q(\mathbf{x}_{t-1} \vert \mathbf{x}_t)$ 也将是高斯分布. 不过，我们难以轻易估算 $q(\mathbf{x}_{t-1} \vert \mathbf{x}_t)$ 因为这需要使用整个数据集。因此，为了执行反向扩散过程，我们需要训练一个模型 $p_\theta$ 来近似这些条件概率。

$p_\theta(\mathbf{x}_{0:T}) = p(\mathbf{x}_T) \prod^T_{t=1} p_\theta(\mathbf{x}_{t-1} \vert \mathbf{x}_t) \quad p_\theta(\mathbf{x}_{t-1} \vert \mathbf{x}_t) = \mathcal{N}(\mathbf{x}_{t-1}; \boldsymbol{\mu}_\theta(\mathbf{x}_t, t), \boldsymbol{\Sigma}_\theta(\mathbf{x}_t, t))$
在这里插入图片描述

图 3

值得注意的是当以 $\mathbf{x}_0$ 为条件时，反向条件概率是易于处理的。

$q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0) = \mathcal{N}(\mathbf{x}_{t-1}; \color{blue}{\tilde{\boldsymbol{\mu}}}(\mathbf{x}_t, \mathbf{x}_0), \color{red}{\tilde{\beta}_t} \mathbf{I})$

使用贝叶斯准则，可以得到：

$\begin{aligned} q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0) &= q(\mathbf{x}_t \vert \mathbf{x}_{t-1}, \mathbf{x}_0) \frac{ q(\mathbf{x}_{t-1} \vert \mathbf{x}_0) }{ q(\mathbf{x}_t \vert \mathbf{x}_0) } \\ &\propto \exp \Big(-\frac{1}{2} \big(\frac{(\mathbf{x}_t - \sqrt{\alpha_t} \mathbf{x}_{t-1})^2}{\beta_t} + \frac{(\mathbf{x}_{t-1} - \sqrt{\bar{\alpha}_{t-1}} \mathbf{x}_0)^2}{1-\bar{\alpha}_{t-1}} - \frac{(\mathbf{x}_t - \sqrt{\bar{\alpha}_t} \mathbf{x}_0)^2}{1-\bar{\alpha}_t} \big) \Big) \\ &= \exp \Big(-\frac{1}{2} \big(\frac{\mathbf{x}_t^2 - 2\sqrt{\alpha_t} \mathbf{x}_t \color{blue}{\mathbf{x}_{t-1}} \color{black}{+ \alpha_t} \color{red}{\mathbf{x}_{t-1}^2} }{\beta_t} + \frac{ \color{red}{\mathbf{x}_{t-1}^2} \color{black}{- 2 \sqrt{\bar{\alpha}_{t-1}} \mathbf{x}_0} \color{blue}{\mathbf{x}_{t-1}} \color{black}{+ \bar{\alpha}_{t-1} \mathbf{x}_0^2} }{1-\bar{\alpha}_{t-1}} - \frac{(\mathbf{x}_t - \sqrt{\bar{\alpha}_t} \mathbf{x}_0)^2}{1-\bar{\alpha}_t} \big) \Big) \\ &= \exp\Big( -\frac{1}{2} \big( \color{red}{(\frac{\alpha_t}{\beta_t} + \frac{1}{1 - \bar{\alpha}_{t-1}})} \mathbf{x}_{t-1}^2 - \color{blue}{(\frac{2\sqrt{\alpha_t}}{\beta_t} \mathbf{x}_t + \frac{2\sqrt{\bar{\alpha}_{t-1}}}{1 - \bar{\alpha}_{t-1}} \mathbf{x}_0)} \mathbf{x}_{t-1} \color{black}{ + C(\mathbf{x}_t, \mathbf{x}_0) \big) \Big)} \end{aligned}$

根据标准高斯密度函数，均值和方差可参数化如下：( $\alpha_t = 1 - \beta_t$ and $\bar{\alpha}_t = \prod_{i=1}^t \alpha_i$ )

$\begin{aligned} \tilde{\beta}_t &= 1/(\frac{\alpha_t}{\beta_t} + \frac{1}{1 - \bar{\alpha}_{t-1}}) = 1/(\frac{\alpha_t - \bar{\alpha}_t + \beta_t}{\beta_t(1 - \bar{\alpha}_{t-1})}) = \color{green}{\frac{1 - \bar{\alpha}_{t-1}}{1 - \bar{\alpha}_t} \cdot \beta_t} \\ \tilde{\boldsymbol{\mu}}_t (\mathbf{x}_t, \mathbf{x}_0) &= (\frac{\sqrt{\alpha_t}}{\beta_t} \mathbf{x}_t + \frac{\sqrt{\bar{\alpha}_{t-1} }}{1 - \bar{\alpha}_{t-1}} \mathbf{x}_0)/(\frac{\alpha_t}{\beta_t} + \frac{1}{1 - \bar{\alpha}_{t-1}}) \\ &= (\frac{\sqrt{\alpha_t}}{\beta_t} \mathbf{x}_t + \frac{\sqrt{\bar{\alpha}_{t-1} }}{1 - \bar{\alpha}_{t-1}} \mathbf{x}_0) \color{green}{\frac{1 - \bar{\alpha}_{t-1}}{1 - \bar{\alpha}_t} \cdot \beta_t} \\ &= \frac{\sqrt{\alpha_t}(1 - \bar{\alpha}_{t-1})}{1 - \bar{\alpha}_t} \mathbf{x}_t + \frac{\sqrt{\bar{\alpha}_{t-1}}\beta_t}{1 - \bar{\alpha}_t} \mathbf{x}_0\\ \end{aligned}$

根据前面所述，我们可以将 $\mathbf{x}_0$ 表示成 $\mathbf{x}_0 = \frac{1}{\sqrt{\bar{\alpha}_t}}(\mathbf{x}_t - \sqrt{1 - \bar{\alpha}_t}\boldsymbol{\epsilon}_t)$ 然后代入上式，可以得到：

$\begin{aligned} \tilde{\boldsymbol{\mu}}_t &= \frac{\sqrt{\alpha_t}(1 - \bar{\alpha}_{t-1})}{1 - \bar{\alpha}_t} \mathbf{x}_t + \frac{\sqrt{\bar{\alpha}_{t-1}}\beta_t}{1 - \bar{\alpha}_t} \frac{1}{\sqrt{\bar{\alpha}_t}}(\mathbf{x}_t - \sqrt{1 - \bar{\alpha}_t}\boldsymbol{\epsilon}_t) \\ &= \color{red}{\frac{1}{\sqrt{\alpha_t}} \Big( \mathbf{x}_t - \frac{1 - \alpha_t}{\sqrt{1 - \bar{\alpha}_t}} \boldsymbol{\epsilon}_t \Big)} \end{aligned}$

如图 2 所示，这样的设置与变分自编码器（VAE）非常相似，因此我们可以使用变分下界来优化负对数似然。

$\begin{aligned} -\log p_\theta(\mathbf{x}_0) &\leq - \log p_\theta(\mathbf{x}_0) + D_\text{KL}(q(\mathbf{x}_{1:T}\vert\mathbf{x}_0) \| p_\theta(\mathbf{x}_{1:T}\vert\mathbf{x}_0) ) & \small{\text{; KL is non-negative}}\\ &= - \log p_\theta(\mathbf{x}_0) + \mathbb{E}_{\mathbf{x}_{1:T}\sim q(\mathbf{x}_{1:T} \vert \mathbf{x}_0)} \Big[ \log\frac{q(\mathbf{x}_{1:T}\vert\mathbf{x}_0)}{p_\theta(\mathbf{x}_{0:T}) / p_\theta(\mathbf{x}_0)} \Big] \\ &= - \log p_\theta(\mathbf{x}_0) + \mathbb{E}_q \Big[ \log\frac{q(\mathbf{x}_{1:T}\vert\mathbf{x}_0)}{p_\theta(\mathbf{x}_{0:T})} + \log p_\theta(\mathbf{x}_0) \Big] \\ &= \mathbb{E}_q \Big[ \log \frac{q(\mathbf{x}_{1:T}\vert\mathbf{x}_0)}{p_\theta(\mathbf{x}_{0:T})} \Big] \\ \text{Let }L_\text{VLB} &= \mathbb{E}_{q(\mathbf{x}_{0:T})} \Big[ \log \frac{q(\mathbf{x}_{1:T}\vert\mathbf{x}_0)}{p_\theta(\mathbf{x}_{0:T})} \Big] \geq - \mathbb{E}_{q(\mathbf{x}_0)} \log p_\theta(\mathbf{x}_0) \end{aligned}$

使用詹森不等式也能直接得出相同的结果。假设我们想将最小化交叉熵作为学习目标。

$\begin{aligned} L_\text{CE} &= - \mathbb{E}_{q(\mathbf{x}_0)} \log p_\theta(\mathbf{x}_0) \\ &= - \mathbb{E}_{q(\mathbf{x}_0)} \log \Big( \int p_\theta(\mathbf{x}_{0:T}) d\mathbf{x}_{1:T} \Big) \\ &= - \mathbb{E}_{q(\mathbf{x}_0)} \log \Big( \int q(\mathbf{x}_{1:T} \vert \mathbf{x}_0) \frac{p_\theta(\mathbf{x}_{0:T})}{q(\mathbf{x}_{1:T} \vert \mathbf{x}_{0})} d\mathbf{x}_{1:T} \Big) \\ &= - \mathbb{E}_{q(\mathbf{x}_0)} \log \Big( \mathbb{E}_{q(\mathbf{x}_{1:T} \vert \mathbf{x}_0)} \frac{p_\theta(\mathbf{x}_{0:T})}{q(\mathbf{x}_{1:T} \vert \mathbf{x}_{0})} \Big) \\ &\leq - \mathbb{E}_{q(\mathbf{x}_{0:T})} \log \frac{p_\theta(\mathbf{x}_{0:T})}{q(\mathbf{x}_{1:T} \vert \mathbf{x}_{0})} \\ &= \mathbb{E}_{q(\mathbf{x}_{0:T})}\Big[\log \frac{q(\mathbf{x}_{1:T} \vert \mathbf{x}_{0})}{p_\theta(\mathbf{x}_{0:T})} \Big] = L_\text{VLB} \end{aligned}$

为了使方程中的每一项都能通过解析方式计算，该目标函数可以进一步改写为几个 KL 散度和熵项的组合。

$\begin{aligned} L_\text{VLB} &= \mathbb{E}_{q(\mathbf{x}_{0:T})} \Big[ \log\frac{q(\mathbf{x}_{1:T}\vert\mathbf{x}_0)}{p_\theta(\mathbf{x}_{0:T})} \Big] \\ &= \mathbb{E}_q \Big[ \log\frac{\prod_{t=1}^T q(\mathbf{x}_t\vert\mathbf{x}_{t-1})}{ p_\theta(\mathbf{x}_T) \prod_{t=1}^T p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t) } \Big] \\ &= \mathbb{E}_q \Big[ -\log p_\theta(\mathbf{x}_T) + \sum_{t=1}^T \log \frac{q(\mathbf{x}_t\vert\mathbf{x}_{t-1})}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)} \Big] \\ &= \mathbb{E}_q \Big[ -\log p_\theta(\mathbf{x}_T) + \sum_{t=2}^T \log \frac{q(\mathbf{x}_t\vert\mathbf{x}_{t-1})}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)} + \log\frac{q(\mathbf{x}_1 \vert \mathbf{x}_0)}{p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1)} \Big] \\ &= \mathbb{E}_q \Big[ -\log p_\theta(\mathbf{x}_T) + \sum_{t=2}^T \log \Big( \frac{q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0)}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)}\cdot \frac{q(\mathbf{x}_t \vert \mathbf{x}_0)}{q(\mathbf{x}_{t-1}\vert\mathbf{x}_0)} \Big) + \log \frac{q(\mathbf{x}_1 \vert \mathbf{x}_0)}{p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1)} \Big] \\ &= \mathbb{E}_q \Big[ -\log p_\theta(\mathbf{x}_T) + \sum_{t=2}^T \log \frac{q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0)}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)} + \sum_{t=2}^T \log \frac{q(\mathbf{x}_t \vert \mathbf{x}_0)}{q(\mathbf{x}_{t-1} \vert \mathbf{x}_0)} + \log\frac{q(\mathbf{x}_1 \vert \mathbf{x}_0)}{p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1)} \Big] \\ &= \mathbb{E}_q \Big[ -\log p_\theta(\mathbf{x}_T) + \sum_{t=2}^T \log \frac{q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0)}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)} + \log\frac{q(\mathbf{x}_T \vert \mathbf{x}_0)}{q(\mathbf{x}_1 \vert \mathbf{x}_0)} + \log \frac{q(\mathbf{x}_1 \vert \mathbf{x}_0)}{p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1)} \Big]\\ &= \mathbb{E}_q \Big[ \log\frac{q(\mathbf{x}_T \vert \mathbf{x}_0)}{p_\theta(\mathbf{x}_T)} + \sum_{t=2}^T \log \frac{q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0)}{p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t)} - \log p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1) \Big] \\ &= \mathbb{E}_q [\underbrace{D_\text{KL}(q(\mathbf{x}_T \vert \mathbf{x}_0) \parallel p_\theta(\mathbf{x}_T))}_{L_T} + \sum_{t=2}^T \underbrace{D_\text{KL}(q(\mathbf{x}_{t-1} \vert \mathbf{x}_t, \mathbf{x}_0) \parallel p_\theta(\mathbf{x}_{t-1} \vert\mathbf{x}_t))}_{L_{t-1}} \underbrace{- \log p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1)}_{L_0} ] \end{aligned}$

我们分别标记变分下界损失中的每个组成部分：

$\begin{aligned} L_\text{VLB} &= L_T + L_{T-1} + \dots + L_0 \\ \text{where } L_T &= D_\text{KL}(q(\mathbf{x}_T \vert \mathbf{x}_0) \parallel p_\theta(\mathbf{x}_T)) \\ L_t &= D_\text{KL}(q(\mathbf{x}_t \vert \mathbf{x}_{t+1}, \mathbf{x}_0) \parallel p_\theta(\mathbf{x}_t \vert\mathbf{x}_{t+1})) \text{ for }1 \leq t \leq T-1 \\ L_0 &= - \log p_\theta(\mathbf{x}_0 \vert \mathbf{x}_1) \end{aligned}$

$L_\text{VLB}$ 中的每一个 KL 项 (除了 $L_0$ ) 都是在比较两个高斯分布，因此可以用闭式解计算. $L_T$ 是常数，在训练过程中可以忽略，因为 $q$ 没有可学习的参数并且 $\mathbf{x}_T$ 是一个高斯噪声. 模型 $L_0$ 依赖一个单独的解码器，该解码器源自 $\mathcal{N}(\mathbf{x}_0; \boldsymbol{\mu}_\theta(\mathbf{x}_1, 1), \boldsymbol{\Sigma}_\theta(\mathbf{x}_1, 1))$

扩散模型（一）

在生成领域，迄今为止有几个主流的模型，分别是 GAN, VAE，Flow 以及 Diffusion 模型。 GAN：GAN 的学习机制是对抗性学习，通过生成器和判别器的对抗博弈来进行学习，这种竞争机制促使生成器不断提升生成能力&a…...

编程日记 2025/8/23 15:46:46

EF Core与ASP.NET Core的集成

目录分层项目中EF Core的用法数据库的配置数据库迁移步骤汇总注意： 批量注册上下文分层项目中EF Core的用法创建一个.NET类库项目BooksEFCore，放实体等类。NuGet：Microsoft.EntityFrameworkCore.RelationalBooksEFCore中增加实…...

编程日记 2025/8/22 19:44:37

深入解析“legit”的地道用法——从俚语到正式表达：Sam Altman用来形容DeepSeek: legit invigorating（真的令人振奋）

深入解析“legit”的地道用法——从俚语到正式表达一、引言在社交媒体、科技圈甚至日常对话中，我们经常会看到或听到“legit”这个词。比如最近 Sam Altman 在 X（原 Twitter）上发的一条帖子中写道： we will obviously deliver …...

编程日记 2025/8/23 15:44:33

玩转ChatGPT：DeepSeek测评（科研思路梳理）

一、写在前面 DeepSeek-R1出圈了，把OpenAI的o3-mini模型都提前逼上线了（还免费使用）。都号称擅长深度推理，那么对于科研牛马的帮助有多大呢？ 我连夜试一试。二、科研思路梳理有时候我们牛马们做了一堆结果以后&…...

编程日记 2025/8/23 15:46:45

实验9 JSP访问数据库（二）

实验9 JSP访问数据库（二） 目的： 1、熟悉JDBC的数据库访问模式。 2、掌握预处理语句的使用实验要求： 1、使用Tomcat作为Web服务器 2、通过JDBC访问数据库，实现增删改查功能的实现 3、要求提交实验报告，将代…...

编程日记 2025/8/22 18:42:52

CMake项目编译与开源项目目录结构

Cmake 使用简单方便，可以跨平台构建项目编译环境，尤其比直接写makefile简单，可以通过简单的Cmake生成负责的Makefile文件。如果没有使用cmake进行编译，需要如下命令：（以muduo库echo服务器为例）…...

编程日记 2025/8/21 17:25:19

PyCharm中使用Ollama安装和应用Deepseek R1模型：完整指南

引言人工智能和大型语言模型正在改变我们与技术交互的方式。Deepseek R1是一个强大的AI模型，而Ollama则是一个让我们能够轻松在本地运行这些模型的工具。本文将指导您如何使用Ollama安装Deepseek R1模型，并在PyCharm中创建一个简单的聊天应用。 © ivwdcwso (ID: u0121…...

编程日记 2025/8/22 18:33:46

编程AI深度实战：大模型知识一文打尽

系列文章： 编程AI深度实战：私有模型deep seek r1，必会ollama-CSDN博客编程AI深度实战：自己的AI，必会LangChain-CSDN博客编程AI深度实战：给vim装上AI-CSDN博客编程AI深度实战：火的编程AI&…...

编程日记 2025/8/22 18:48:05

012-51单片机CLD1602显示万年历+闹钟+农历+整点报时

1. 硬件设计硬件是我自己设计的一个通用的51单片机开发平台，可以根据需要自行焊接模块，这是用立创EDA画的一个双层PCB板，所以模块都是插针式，不是表贴的。电路原理图在文末的链接里，PCB图暂时不选择开源。 B站上传的…...

编程日记 2025/8/23 11:03:17

基于springboot+vue的哈利波特书影音互动科普网站

开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql 5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：…...

编程日记 2025/8/22 23:50:01

MySQL5.5升级到MySQL5.7

【卸载原来的MySQL】 cmd打开命令提示符窗口（管理员身份）net stop mysql（先停止MySQL服务） 3.卸载切换到原来5.5版本的bin目录，输入mysqld remove卸载服务测试mysql -V查看Mysql版本还是5.5 查看了环境变量里的…...

编程日记 2025/8/22 23:54:54

列表标签（无序列表、有序列表）

无序列表 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </head><…...

编程日记 2025/8/23 15:44:32

【数据结构】_链表经典算法OJ：分割链表（力扣—中等）

目录 1. 题目描述及链接 2. 解题思路 2.1 思路1 2.2 思路2 2.3 思路3（本题采取该解法） 3. 题解程序 1. 题目描述及链接题目链接：面试题 02.04. 分割链表 - 力扣（LeetCode） 题目描述： 给你一个链表…...

编程日记 2025/8/23 15:44:59

深入核心：一步步手撕Tomcat搭建自己的Web服务器

介绍： servlet：处理 http 请求 tomcat：服务器 Servlet servlet 接口： 定义 Servlet 声明周期初始化：init服务：service销毁：destory 继承链： Tomcat Tomcat 和 servlet 原理&#x…...

编程日记 2025/8/22 18:57:25

ASP.NET Core与配置系统的集成

目录配置系统默认添加的配置提供者加载命令行中的配置。运行环境读取方法 User Secrets 注意事项 Zack.AnyDBConfigProvider 案例配置系统默认添加的配置提供者加载现有的IConfiguration。加载项目根目录下的appsettings.json。加载项目根目录下的appsettin…...

编程日记 2025/8/22 19:16:45

在 Ubuntu 上安装 Node.js 23.x

在 Ubuntu 上安装 Node.js 23.x 前提条件安装步骤1. 下载设置脚本2. 运行设置脚本3. 安装 Node.js4. 验证安装参考链接总结在现代 web 开发中，Node.js 是一个不可或缺的工具。它提供了一个强大的 JavaScript 运行时环境，使得开发人员可以在服务器端使用…...

编程日记 2025/8/23 7:06:16

《 C++ 点滴漫谈：二十五》空指针，隐秘而危险的杀手：程序崩溃的真凶就在你眼前！

摘要本博客全面解析了 C 中指针与空值的相关知识，从基础概念到现代 C 的改进展开，涵盖了空指针的定义、表示方式、使用场景以及常见注意事项。同时，深入探讨了 nullptr 的引入及智能指针在提升代码安全性和简化内存管理方面的优势。通过实际…...

编程日记 2025/8/23 9:45:19

SpringBoot中Excel表的导入、导出功能的实现

文章目录一、easyExcel简介二、Excel表的导出2.1 添加 Maven 依赖2.2 创建导出数据的实体类4. 编写导出接口5. 前端代码6. 实现效果三、excel表的导出1. Excel表导入的整体流程1.1 配置文件存储路径 2. 前端实现2.1 文件上传组件 2.2 文件上传逻辑3. 后端实现3.1 文件上传接口…...

编程日记 2025/8/20 18:23:35

CodeGPT使用本地部署DeepSeek Coder

目前NV和github都托管了DeepSeek，生成Key后可以很方便的用CodeGPT接入。CodeGPT有三种方式使用AI，分别时Agents，Local LLMs（本地部署AI大模型），LLMs Cloud Model（云端大模型，从你自己…...

编程日记 2025/8/21 5:02:33

SpringBoot 整合 SpringMVC：配置嵌入式服务器

修改和 server 相关的配置(ServerProperties)： server.port8081 server.context‐path/tx server.tomcat.uri‐encodingUTF‐8 注册 Servlet 三大组件：Servlet、Fileter、Listener SpringBoot 默认是以 jar 包的方式启动嵌入式的 Servlet 容器来启动 Spr…...

编程日记 2025/8/22 9:55:13

浅谈Linux 权限、压缩、进程与服务

概述放假回家，对Linux系统的一些知识进行重新的整理，做到温故而知新，对用户权限管理、文件赋权、压缩文件、进程与服务的知识进行了一次梳理和总结。权限管理 Linux最基础的权限是用户和文件，先了解基础的用户权限和文件权限…...

编程日记 2025/8/22 6:59:59

LeetCode 0040.组合总和 II：回溯 + 剪枝

【LetMeFly】40.组合总和 II：回溯剪枝力扣题目链接：https://leetcode.cn/problems/combination-sum-ii/ 给定一个候选人编号的集合 candidates 和一个目标数 target ，找出 candidates 中所有可以使数字和为 target 的组合。 candidates…...

编程日记 2025/8/22 10:50:19

springCload快速入门

原作者：3. SpringCloud - 快速通关前置知识： Java17及以上、MavenSpringBoot、SpringMVC、MyBatisLinux、Docker 1. 分布式基础 1.1. 微服务微服务架构风格，就像是把一个单独的应用程序开发为一套小服务，每个小服务运行在自…...

编程日记 2025/8/23 2:18:07

实现使用K210单片机进行猫脸检测，并在检测到猫脸覆盖屏幕50%以上时执行特定操作

要实现使用K210单片机进行猫脸检测，并在检测到猫脸覆盖屏幕50%以上时执行特定操作，以及通过WiFi上传图片到微信小程序，并在微信小程序中上传图片到开发板进行训练，可以按照以下步骤进行： 1. 硬件连接确保K210开发板…...

编程日记 2025/8/22 9:42:24

FlashAttention v1 论文解读

论文标题：FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness 论文地址：https://arxiv.org/pdf/2205.14135 FlashAttention 是一种重新排序注意力计算的算法，它无需任何近似即可加速注意力计算并减少内存占用。…...

编程日记 2025/8/23 5:48:42

Kafka 副本机制（包含AR、ISR、OSR、HW 和 LEO 介绍）

文章目录 Kafka 副本机制（包含AR、ISR、OSR、HW 和 LEO 介绍）1. 副本的基本概念2. 副本同步和一致性2.1 AR（Assigned Replicas）2.2 ISR（In-Sync Replicas）2.3 OSR（Out-of-Sync Replicas&#xf…...

编程日记 2025/8/23 14:46:29

QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI？

问题提出 QtCreator在配置Compilers时,有一个叫ABI的选项,那么什么是ABI？ ABI（Application Binary Interface）介绍 ABI（Application Binary Interface，应用二进制接口）是指应用程序与操作系统或其他程序…...

编程日记 2025/8/22 16:34:59

ResNet--深度学习中的革命性网络架构

一、引言在深度学习的研究和应用中，网络架构的设计始终是一个关键话题。随着计算能力和大数据的不断提升，深度神经网络逐渐成为解决复杂任务的主流方法。然而，随着网络层数的增加，训练深度神经网络往往面临梯度消失或梯度爆炸的…...

编程日记 2025/8/23 10:02:31

【软件测试项目实战】以淘宝网购物车管理功能为例

一、测试功能模块分析选择淘宝网购物车管理功能进行测试，核心子功能包含： 单商品添加/删除购物车商品数量修改多商品勾选与批量删除失效商品识别与处理二、测试用例设计方法论应用 1. 等价类划分法（商品添加操作） 分析&…...

编程日记 2025/8/21 22:07:45

Go 中 defer 的机制

文章目录 Go 语言中 defer 的底层机制与实战解析一、defer 的执行顺序：后进先出（LIFO）示例 ：多个 defer 的执行顺序二、defer 的参数预计算：值拷贝的陷阱示例 ：参数预计算的影响三、defer 与闭包&#xf…...

编程日记 2025/8/23 7:38:40

智能小区物业管理系统推动数字化转型与提升用户居住体验

内容概要在当今快速发展的社会中，智能小区物业管理系统的出现正在改变传统的物业管理方式。这种系统不仅仅是一种工具，更是一种推动数字化转型的重要力量。它通过高效的技术手段，将物业管理与用户居住体验紧密结合，无疑为社区带…...

编程日记 2025/8/22 18:36:58

【memgpt】letta 课程4：基于latta框架构建MemGpt代理并与之交互

Lab 3: Building Agents with memory 基于latta框架构建MemGpt代理并与之交互理解代理状态，例如作为系统提示符、工具和agent的内存查看和编辑代理存档内存MemGPT 代理是有状态的 agents的设计思路每个步骤都要定义代理行为 Letta agents persist information over time and…...

编程日记 2025/8/23 8:10:24

HTML DOM 对象

HTML DOM 对象引言 HTML DOM（文档对象模型）是现代网页开发的核心技术之一。DOM 将 HTML 或 XML 文档结构化，使其成为可编程的对象。通过 DOM，开发者可以轻松地操作网页内容、样式和结构。本文将详细介绍 HTML DOM 对象的相关知识，包括其概念、结构、操作方法以及在实际…...

编程日记 2025/8/20 10:12:41

高温环境对电机性能的影响与LabVIEW应用

电机在高温环境下的性能可能受到多种因素的影响，尤其是对于持续工作和高负荷条件下的电机。高温会影响电机的效率、寿命以及可靠性，导致设备出现过热、绝缘损坏等问题。因此，在设计电机控制系统时，特别是在高温环境下，…...

编程日记 2025/8/22 11:02:28

【09-电源线布线与覆铜 GND与转孔】

走线从接触点处走线 TYPEC画线-加铜皮 1.关闭不需要的层(锡膏层和阻焊层和机械层) 紫色阻焊层 L: 顶层锡膏底层锡膏顶层阻焊底层阻焊 2.修改线框或者贴铜 3.顶层走不过去:打四个孔核心:走线-打孔-贴铜皮设置孔的参数:大小和人为盖有挨一下其他才会有网络 4个孔也要贴…...

编程日记 2025/8/22 15:06:01

算法题（48）：反转链表

审题： 需要我们将链表反转并返回头结点地址思路： 一般在面试中，涉及链表的题会主要考察链表的指向改变，所以一般不会允许我们改变节点val值。这里是单向链表，如果要把指向反过来则需要同时知道前中后三个节点&#x…...

编程日记 2025/8/22 20:09:01

C++ 泛型编程指南02 (模板参数的类型推导)

文章目录一深入了解C中的函数模板类型推断什么是类型推断？使用Boost TypeIndex库进行类型推断分析示例代码关键点解析 2. 理解函数模板类型推断2.1 指针或引用类型2.1.1 忽略引用2.1.2 保持const属性2.1.3 处理指针类型 2.2 万能引用类型2.3 传值方式2.4 传值方式…...

编程日记 2025/8/23 0:04:28

穷举vs暴搜vs深搜vs回溯vs剪枝系列一＞单词搜索

题解如下题目：解析决策树：代码设计： 代码： 题目： 解析决策树： 代码设计： 代码： class Solution {private boolean[][] visit;//标记使用过的数据int m,n;//行，列char…...

编程日记 2025/8/23 10:33:54

9 点结构模块（point.rs）

一、point.rs源码 use super::UnknownUnit; use crate::approxeq::ApproxEq; use crate::approxord::{max, min}; use crate::length::Length; use crate::num::*; use crate::scale::Scale; use crate::size::{Size2D, Size3D}; use crate::vector::{vec2, vec3, Vector2D, V…...

编程日记 2025/8/22 21:56:54

Forward diffusion process

Connection with stochastic gradient Langevin dynamics

Reverse diffusion process

相关文章：