全面解析DeepSeek算法细节(2) —— 多令牌预测(Multi Token Prediction)
概述
多令牌预测(MTP)技术使DeepSeek-R1能够并行预测多个令牌,显著提升推理速度。
关键特性
- 并行多令牌预测:DeepSeek-R1通过同时预测多个令牌而非按顺序预测,提升了推理速度。这减少了解码延迟,在不影响连贯性的前提下加快文本生成。
- 跨层深度残差连接:与DeepSeek-V3仅依据先前模块的输出进行令牌预测不同,DeepSeek-R1在MTP层之间整合了残差连接。这使更深层的MTP模块能够利用较浅层的特征,从而改善长距离依赖关系。
- 自适应预测粒度:模型根据输入序列的复杂程度,动态调整每个模块预测的未来令牌数量。这确保在处理短文本时能进行精细预测,而在处理长序列时能有更宽泛的前瞻。
- 深度感知损失加权:DeepSeek-R1通过基于Sigmoid的加权函数,优先考虑中等深度的MTP层,优化了训练目标。这引导更多的梯度更新作用于效果最显著的部分,提高了学习效率。
- 内存高效的参数共享:该模型通过在不同MTP深度间复用Transformer层来减少内存消耗。DeepSeek-R1采用基于深度条件的路由,而非为每个模块设置单独的层,在保持独特的深度表示的同时,将冗余计算降至最低。
- 优化的推测解码:DeepSeek-R1通过引入概率一致性检查改进了推测解码。预测结果依据置信度阈值来接受,而不是要求完全匹配,这降低了拒绝率并加快了推理速度。
- 训练和推理中的实际收益:由于这些改进,DeepSeek-R1的训练收敛速度加快了22%,生成速度提升了1.5倍,长文本的困惑度降低了18%,展现出相较于DeepSeek-V3的优越性。
从DeepSeek-V3到DeepSeek-R1的演进
DeepSeek-V3中的多令牌预测(MTP)
- MTP在DeepSeek-V3中作为一种训练目标被引入,旨在通过使模型能够在每个位置预测多个未来令牌,来提升数据利用效率和预测能力。与传统的下一个令牌预测(将训练限制为单步前向预测)不同,MTP将预测范围扩展到多个未来令牌,从而强化了训练信号,并增强了文本生成中的长期连贯性。
- DeepSeek-V3通过一个结构化的流水线来实现MTP,其中包含多个关键设计,如顺序预测模块、共享嵌入和输出头,以及分层损失函数。这些创新提升了模型性能,支持推测解码,并提高了整体数据效率。DeepSeek-R1在这些基础上进一步优化了MTP的实现,以改进推理任务。
- 接下来的小节将详细介绍DeepSeek-V3中为支持MTP而引入的特性。
顺序多令牌预测模块
- DeepSeek-V3使用 D D D 个顺序MTP模块,每个模块负责预测一个额外的未来令牌。与Gloeckle 等人2024年在论文《通过多令牌预测实现更好更快的大语言模型》中提出的用独立输出头并行预测未来令牌的方式不同,DeepSeek-V3在预测深度间保持因果链,确保每个令牌都以前续MTP模块的输出为条件。
- 对于第 k k k 个MTP模块,在深度 k k k 处第 i i i 个输入令牌的表示计算如下:
h i ( k ) = M k [ RMSNorm ( h i ( k − 1 ) ) ; RMSNorm ( Emb ( t i + k ) ) ] h^{(k)}_i = M_k[\text{RMSNorm}(h^{(k - 1)}_i); \text{RMSNorm}(\text{Emb}(t_{i + k}))] hi(k)=Mk[RMSNorm(hi(k−1));RMSNorm(Emb(ti+k))]- 其中:
- h i ( k − 1 ) h^{(k - 1)}_i hi(k−1) 是前一深度的表示(当 k = 1 k = 1 k=1 时,来自主模型)。
- M k ∈ R d × 2 d M_k \in \mathbb{R}^{d\times 2d} Mk∈Rd×2d 是投影矩阵。
- Emb ( ⋅ ) \text{Emb}(\cdot) Emb(⋅) 是共享嵌入函数。
- 其中:
- 每个模块都应用一个Transformer块:
h 1 : T − k ( k ) = TRM k ( h 1 : T − k ( k ) ) h^{(k)}_{1:T - k} = \text{TRM}_k(h^{(k)}_{1:T - k}) h1:T−k(k)=TRMk(h1:T−k(k))- 其中 T T T 是输入序列长度。该模块的输出被传递到一个共享输出头:
P i + k + 1 ( k ) = OutHead ( h i ( k ) ) P^{(k)}_{i + k + 1} = \text{OutHead}(h^{(k)}_i) Pi+k+1(k)=OutHead(hi(k)) - 其中 P i + k + 1 ( k ) P^{(k)}_{i + k + 1} Pi+k+1(k) 是第 k k k 个未来令牌的概率分布。
- 其中 T T T 是输入序列长度。该模块的输出被传递到一个共享输出头:
多令牌预测(MTP)的训练目标
- 对于每个预测深度 k k k,DeepSeek-V3 计算交叉熵损失:
L MTP ( k ) = − 1 T ∑ i = 2 + k T + 1 log P i ( k ) [ t i ] L^{(k)}_{\text{MTP}} = \frac{-1}{T} \sum_{i = 2 + k}^{T + 1} \log P^{(k)}_i[t_i] LMTP(k)=T−1i=2+k∑T+1logPi(k)[ti]- 其中 t i t_i ti 是位置 i i i 处的真实令牌, P i ( k ) [ t i ] P^{(k)}_i[t_i] Pi(k)[ti] 是该令牌的预测概率。整体的 MTP 损失是所有深度损失的平均值,并乘以一个因子 λ \lambda λ:
L MTP = λ D ∑ k = 1 D L MTP ( k ) L_{\text{MTP}} = \frac{\lambda}{D} \sum_{k = 1}^{D} L^{(k)}_{\text{MTP}} LMTP=Dλk=1∑DLMTP(k) - 其中 D D D 是 MTP 模块的数量。
- 其中 t i t_i ti 是位置 i i i 处的真实令牌, P i ( k ) [ t i ] P^{(k)}_i[t_i] Pi(k)[ti] 是该令牌的预测概率。整体的 MTP 损失是所有深度损失的平均值,并乘以一个因子 λ \lambda λ:
基于共享嵌入和输出头的内存优化
- 为了将 MTP 模块带来的额外内存开销降至最低,DeepSeek-V3 采取了以下措施:
- 在多个 MTP 模块间共享嵌入。
- 使用单个共享输出头,而非为每个 MTP 深度设置独立的输出头。
- 在主模型和 MTP 模块之间实现权重共享。
- 这种设计确保了 MTP 训练中的额外前向传播不会大幅增加参数存储需求。
推理策略和推测解码
- 虽然 MTP 主要用于改进训练,DeepSeek-V3 也探索了在推理时将 MTP 模块用于推测解码。其思路是将额外的令牌预测作为推测补全,这与莱维坦(Leviathan)等人在2023年的论文《通过推测解码实现Transformer的快速推理》中提出的方法类似:
- 主模型像往常一样预测令牌 t i + 1 t_{i + 1} ti+1。
- 第一个 MTP 模块同时预测 t i + 2 t_{i + 2} ti+2,以便尽早验证令牌的连贯性。
- 如果 MTP 预测结果与集束搜索结果匹配,就可以一次性输出多个令牌。
- 该策略在保持输出流畅性的同时,显著加快了推理速度。
关于多令牌预测的消融实验
- DeepSeek-V3 进行了详细的消融实验,以评估 MTP 的影响。主要发现包括:
- 对训练效率的影响:使用 MTP 进行训练可使数据效率提高 15%,从而加快训练速度。
- 对长期连贯性的影响:与传统的下一个令牌预测相比,使用 MTP 训练的模型在较长序列长度下的困惑度改善更为明显。
- 对推测解码准确性的影响:在解码中加入 MTP 模块可将推测生成中的拒绝率降低 35%,提高了延迟效益。
DeepSeek-R1中的改进
DeepSeek-R1在DeepSeek-V3建立的结构化多令牌预测(MTP)框架基础上,对MTP进行了重大改进。这些改进主要集中在更好地对令牌依赖关系进行建模、自适应预测粒度、优化损失函数、以高效内存方式进行参数共享,以及优化推理策略。这些增强功能使DeepSeek-R1具备卓越的推理能力,提高了训练效率,并显著降低了推理延迟。下面,我们将详细介绍每个特性。
在MTP中改进令牌依赖关系建模
- DeepSeek-R1通过在MTP层之间引入跨层深度残差连接,增强了MTP模块的顺序特性。与DeepSeek-V3中每个MTP模块仅严格基于先前模块的输出预测令牌不同,DeepSeek-R1引入了基于深度的特征聚合,以促进更丰富的信息传播。
- 在第 k k k 层深度处,更新后的令牌表示计算如下:
h i ( k ) = M k [ RMSNorm ( h i ( k − 1 ) ) ; RMSNorm ( Emb ( t i + k ) ) ; Res ( h i ( k − 2 ) ) ] h^{(k)}_i = M_k[\text{RMSNorm}(h^{(k - 1)}_i); \text{RMSNorm}(\text{Emb}(t_{i + k})); \text{Res}(h^{(k - 2)}_i)] hi(k)=Mk[RMSNorm(hi(k−1));RMSNorm(Emb(ti+k));Res(hi(k−2))]- 其中:
- Res ( h i ( k − 2 ) ) \text{Res}(h^{(k - 2)}_i) Res(hi(k−2)) 是来自前两层深度的残差连接,并由可学习的标量 α k \alpha_k αk 加权:
Res ( h i ( k − 2 ) ) = α k ⋅ h i ( k − 2 ) \text{Res}(h^{(k - 2)}_i) = \alpha_k \cdot h^{(k - 2)}_i Res(hi(k−2))=αk⋅hi(k−2)
- Res ( h i ( k − 2 ) ) \text{Res}(h^{(k - 2)}_i) Res(hi(k−2)) 是来自前两层深度的残差连接,并由可学习的标量 α k \alpha_k αk 加权:
- 其中:
- 这一修改确保了更深层的MTP模块能够从多个深度接收上下文特征,从而在多步预测中提高连贯性。
自适应预测粒度
- DeepSeek-R1通过根据输入的上下文长度和复杂程度,动态调整每个模块预测的未来令牌数量,优化了MTP的粒度。DeepSeek-R1并非固定每一步预测的令牌数量,而是动态调整预测范围。
- 在第 k k k 层深度预测的未来令牌数量 N k N_k Nk 由下式给出:
N k = min ( ⌊ γ k ⋅ T ⌋ , D − k ) N_k = \min(\lfloor \gamma_k \cdot T \rfloor, D - k) Nk=min(⌊γk⋅T⌋,D−k)- 其中:
- γ k \gamma_k γk 是一个可学习的缩放因子,用于确定自适应粒度。
- T T T 是序列长度。
- D D D 是MTP的最大深度。
- 其中:
- 原理:在序列的起始部分,更短的预测范围(1 - 2个未来令牌)有助于精确的令牌对齐;而在序列靠后的部分,模型会扩展预测范围,以提高效率,同时不牺牲准确性。
用于多层深度学习的损失函数优化
- DeepSeek-R1通过引入深度感知加权的方式,改进了多令牌预测(MTP)的损失函数公式,以便在特定深度上优先进行学习。在DeepSeek-V3中,所有深度的权重是相等的,这导致在深度过深或过浅时优化效率低下 。
- 新的深度加权MTP损失公式如下:
L MTP = λ D ∑ k = 1 D w k ⋅ L MTP ( k ) L_{\text{MTP}} = \frac{\lambda}{D} \sum_{k = 1}^{D} w_k \cdot L^{(k)}_{\text{MTP}} LMTP=Dλk=1∑Dwk⋅LMTP(k)- 其中:
- w k w_k wk 是一个与深度相关的加权因子:
w k = 1 1 + e − β ( k − D / 2 ) w_k = \frac{1}{1 + e^{-\beta(k - D/2)}} wk=1+e−β(k−D/2)1 - 这种基于Sigmoid函数的加权方式确保了中等深度的MTP层能够接收到更强的梯度信号,从而在不同深度间实现更均衡的学习效果。
- w k w_k wk 是一个与深度相关的加权因子:
- 其中:
通过参数共享优化内存效率
- DeepSeek-R1的一个主要改进在于跨MTP模块的参数共享策略,在保持不同深度的独特表示的同时,显著降低了内存开销。
- 与DeepSeek-V3中为每个MTP层单独设置Transformer层不同,DeepSeek-R1通过基于深度条件的路由,复用主模型的层。
- 在深度 k k k 处的令牌表示现在会通过一个单独的、共享的Transformer层,并加上额外的深度嵌入:
h 1 : T − k ( k ) = TRM ( h 1 : T − k ′ ( k ) , DepthEmb ( k ) ) h^{(k)}_{1:T - k} = \text{TRM}(h'^{(k)}_{1:T - k}, \text{DepthEmb}(k)) h1:T−k(k)=TRM(h1:T−k′(k),DepthEmb(k)) - 深度嵌入 DepthEmb ( k ) \text{DepthEmb}(k) DepthEmb(k) 确保了不同的MTP层在利用相同计算图的同时,保留独特的学习特性。
基于推测解码的增强推理策略
- DeepSeek-R1通过支持自适应的令牌验证,显著优化了DeepSeek-V3中引入的推测解码策略。具体内容如下:
- 在DeepSeek-V3中,推测解码仅限于贪婪一致性检查,即只有当多令牌预测(MTP)的预测结果与主模型的输出完全匹配时,才会用于加速推理。
- DeepSeek-R1引入了概率一致性检查。当满足以下条件时,来自MTP的预测令牌 t ^ i + 2 \hat{t}_{i + 2} t^i+2 会被接受:
P MTP ( 1 ) ( t ^ i + 2 ) > τ P Main ( t ^ i + 2 ) P_{\text{MTP}}^{(1)}(\hat{t}_{i + 2}) > \tau P_{\text{Main}}(\hat{t}_{i + 2}) PMTP(1)(t^i+2)>τPMain(t^i+2) - 其中:
- P MTP ( 1 ) ( t ^ i + 2 ) P_{\text{MTP}}^{(1)}(\hat{t}_{i + 2}) PMTP(1)(t^i+2) 是MTP模块对该令牌的预测概率。
- P Main ( t ^ i + 2 ) P_{\text{Main}}(\hat{t}_{i + 2}) PMain(t^i+2) 是主模型对该令牌的预测概率。
- τ \tau τ 是一个可调整的接受阈值。
- 影响:即使高置信度的推测预测与主模型的最高预测不完全匹配,该策略也能采用这些预测,将拒绝率降低了40%以上,从而加速推理。
DeepSeek-R1中MTP改进的实际收益
与DeepSeek-V3相比,DeepSeek-R1对MTP的优化带来了显著的实际收益:
- 训练效率:由于深度加权损失的优先级设定,训练收敛速度提高了22%。
- 推理速度:推测解码的优化使生成速度加快了1.5倍。
- 长期连贯性:长文本的困惑度降低了18%,这表明改进后的令牌依赖关系建模增强了长距离的上下文保留能力。
对比分析
DeepSeek-R1 在DeepSeek-V3的基础多令牌预测(MTP)结构之上进行了改进,同时解决了其存在的局限性。这些改进,尤其是在自适应粒度、损失函数优化和推测解码方面,使得预测速度更快、连贯性更强且内存使用更高效。这些优化共同提升了DeepSeek-R1的推理能力和推理性能。下表对DeepSeek-V3和DeepSeek-R1中MTP的关键特性进行了对比总结。
特性 | DeepSeek-V3 | DeepSeek-R1 |
---|---|---|
顺序MTP模块 | ✔ 具有顺序深度模块的结构化流水线 | ✔ 通过跨层深度残差连接增强 |
MTP的共享嵌入 | ✔ 跨模块共享令牌嵌入 | ✔ 通过基于深度条件的路由进一步优化 |
预测粒度 | ✖ 每个模块预测的未来令牌数量固定 | ✔ 基于序列复杂性的自适应令牌预测范围 |
损失函数优化 | ✖ MTP各深度的损失权重一致 | ✔ 采用深度感知加权以优化学习 |
内存优化策略 | ✔ 共享输出头以减少内存占用 | ✔ 通过基于深度条件的层共享进一步改进 |
通过MTP提升推理速度 | ✔ 基本的推测解码 | ✔ 概率推测解码,拒绝率降低40% |
训练效率提升 | ✔ 数据效率提高15% | ✔ 改进损失优先级,收敛速度加快22% |
预测的长期连贯性 | ✔ 比下一个令牌预测模型有所改进 | ✔ 长文本的困惑度降低18% |
推测解码接受策略 | ✖ 验证需要严格的令牌匹配 | ✔ 基于置信度阈值的概率验证 |
对延迟降低的影响 | ✔ 解码速度有一定提升 | ✔ 因拒绝率降低,推理速度加快1.5倍 |
实现细节
- DeepSeek-R1采用了先进的多令牌预测(MTP)策略,以提高解码效率并降低延迟。与传统的自回归解码(每个令牌按顺序预测)不同,MTP允许在每个解码步骤中并行预测多个令牌。这是通过分层方法实现的,该方法在提升性能的同时,也平衡了错误传播的风险。具体如下:
- 多层表示传播:
- DeepSeek-R1的Transformer架构得到了增强,以支持在多个层同时进行令牌预测。
- 模型中的每一层在保持序列一致性的同时,独立计算令牌的概率。
- 推测解码与验证:
- 在推理过程中,DeepSeek-R1生成推测性的多令牌序列,并通过分层令牌验证机制来验证其连贯性。
- 该方法根据置信度分数动态调整每一步预测的令牌数量,确保在确定最终输出之前,对低置信度的令牌重新评估 。
- 训练目标:
- 该模型在训练时结合了用于下一个令牌预测的标准交叉熵损失,以及一个辅助损失,以促进并行令牌预测。
- 损失函数公式为:
L MTP = λ ∑ k = 1 D L C E ( P k , T k ) L_{\text{MTP}} = \lambda \sum_{k = 1}^{D} L_{CE}(P_k, T_k) LMTP=λk=1∑DLCE(Pk,Tk) - 其中, D D D 是每一步预测的并行令牌数量, L C E L_{CE} LCE 表示每个预测令牌的交叉熵损失。
- 基于强化学习的自适应令牌选择:
- DeepSeek-R1采用基于强化学习(RL)的方法来优化多令牌预测,确保优先选择高质量的令牌序列。
- RL框架根据连贯性、流畅性以及与真实数据的匹配程度来分配奖励。
- 这种由RL驱动的策略有效地减少了生成文本中的幻觉问题,并提高了长距离的连贯性。
- 内存与计算效率:
- MTP模块经过优化,利用Transformer层内的权重共享机制,将额外的内存开销降至最低。
- 推测解码机制与DeepSeek-R1的缓存策略有效整合,避免了冗余计算。
数学公式
- 预测函数遵循自回归公式:
P ( y t ∣ x ) = ∏ t = 1 T P ( y t ∣ y < t , x ) P(y_t|x) = \prod_{t = 1}^{T} P(y_t|y_{<t}, x) P(yt∣x)=t=1∏TP(yt∣y<t,x) - 通过引入并行解码,DeepSeek-R1将推理复杂度从 O ( T ) O(T) O(T) 降低到 O ( T k ) O(\frac{T}{k}) O(kT),其中 k k k 是每一步预测的令牌数量。
相关文章:
全面解析DeepSeek算法细节(2) —— 多令牌预测(Multi Token Prediction)
概述 多令牌预测(MTP)技术使DeepSeek-R1能够并行预测多个令牌,显著提升推理速度。 关键特性 并行多令牌预测:DeepSeek-R1通过同时预测多个令牌而非按顺序预测,提升了推理速度。这减少了解码延迟,在不影响…...
如何从大规模点集中筛选出距离不小于指定值的点
一、背景:当点集处理遇见效率挑战 在数字化浪潮席卷各行各业的今天,点集数据处理已成为地理信息系统(GIS)、计算机视觉、粒子物理仿真等领域的核心需求。以自动驾驶场景为例,激光雷达每秒可产生超过10万个点云数据&am…...
单片机-89C51部分:6、数码管
飞书文档https://x509p6c8to.feishu.cn/wiki/WRNLwDd0iiG8OWkyatOcom6knHf 一、数码管简介 通俗解释: 一个数码管等于八个LED组合在一起,想要显示什么形状,就点亮对应LED即可。 一般数码管分为共阴极数码管和共阳极数码管。 共阳极接法&…...
可解释人工智能(XAI):让机器决策透明化
在人工智能(AI)技术飞速发展的今天,AI 系统已经广泛应用于金融、医疗、交通等多个关键领域。然而,随着 AI 系统的复杂性不断增加,尤其是深度学习模型的广泛应用,AI 的“黑箱”问题逐渐凸显。AI 系统的决策过…...
深入理解网络原理:TCP协议详解
在现代计算机网络中,传输控制协议(TCP,Transmission Control Protocol)是最常用的传输层协议之一。TCP被广泛应用于互联网中的许多关键应用,如网页浏览、电子邮件和文件传输等。作为一种面向连接的协议,TCP…...
二极管钳位电路——Multisim电路仿真
目录 二极管钳位电路 2.1 二极管正向钳位电路 二极管压降测试 2.1.1 二极管正向钳位电路图 2.1.2 二极管正向钳位工作原理 2.2 二极管负向钳位电路 2.2.1 二极管负向钳位电路图 2.2.2 二极管负向钳位工作原理 二极管正向反向钳位仿真电路实验结果 2.3 二极管顶部钳位…...
【更新】LLM Interview (2)
字数溢出,不解释 前文:llm interview (1) 文章目录 强化学习专题1 什么是RL?2 RL和监督、非监督、深度学习的区别3 RL中所谓的损失函数与深度学习中的损失函数有何区别?4 RL历史5 RL分类5.1 分类图示5.2 根据智能体动作选取方式分…...
第二节:文件系统
理论知识 文件系统的基本概念:文件系统是操作系统中负责管理持久数据的子系统,它将数据组织成文件和目录的形式,方便用户存储和访问数据。Linux文件系统的类型:常见的 Linux 文件系统类型有 Ext2、Ext3、Ext4、XFS、Btrfs 等。Ex…...
astrbot_plugin_composting_bucket开源程序是一个用于降低AstrBot的deepseek api调用费用的插件
一、软件介绍 文末提供程序和源码下载 astrbot_plugin_composting_bucket开源程序是一个用于降低AstrBot的deepseek api调用费用的插件,让deepseek api调用费用更低! 本插件功能已集成到 AstrBot ,您可以移除此插件,在 AstrBot…...
8.Three.js中的 StereoCamera 立体相机详解+示例代码
✨ 运行效果 👀 左边一幅图、右边一幅图,略微偏移,形成立体感~ (戴上VR眼镜或红蓝3D眼镜体验更明显哦~) 🔥 小球或方块旋转中,左右略微不同步,立体感更强&am…...
MYSQL——时间字段映射Java类型
在 Java 中查询数据库中的【时间字段】时,可以使用以下几种类型来处理: 1. java.sql.Date 适用场景:当数据库中的时间字段是 date 类型时,使用 java.sql.Date 是最合适的选择。示例代码:ResultSet rs statement.exe…...
搭建speak yarn集群:从零开始的详细指南
在大数据处理领域,Apache Spark 是一个高性能的分布式计算框架,而 YARN(Yet Another Resource Negotiator)是 Hadoop 的资源管理器。将 Spark 集成到 YARN 中,不仅可以充分利用 Hadoop 的资源管理能力,还能…...
第十三章-PHP MySQL扩展
第十三章-PHP与MySQL 一,连接数据库 1. 使用 MySQLi(面向对象方式) <?php // 数据库参数 $host localhost; $username root; $password ; $database test_db;// 创建连接 $conn new mysqli($host, $username, $password, $databa…...
在服务器中,搭建FusionCompute,实现集群管理
序:需要自备一台服务器,并安装部署好KVM,自行下载镜像,将所需的CNA和VRM镜像放到服务器中,小编所用的进项版本如下,读者可自行根据需求下载其它版本的镜像。 CNA镜像:FusionCompute_CNA-8.3.0-…...
嵌入式开发学习日志Day11
一、函数的递归调用 在调用一个函数的过程中,又出现直接或者间接的调用函数本身,称之为函数的递归调用; 函数的递归调用是使用大量的内存空间完成程序进行的; 1.间接调用 2.直接调用 注意: 上图仅为示意,…...
【线性规划】对偶问题的实际意义与重要性质 学习笔记
【线性规划】对偶问题的实际意义与重要性质_哔哩哔哩_bilibili...
代码随想录第30天:动态规划3
一、01背包理论基础(Kama coder 46) “01背包”:有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i],得到的价值是value[i] 。每件物品只能用一次,求解将哪些物品装入背包里物品价值总和最大。 1. 确…...
DSP48E2 的 MAC模式功能仿真
DSP48E2 仿真代码: 测试的功能为 P i ( A D ) ∗ B P i − 1 P_{i} (AD) * B P_{i-1} Pi(AD)∗BPi−1 timescale 1ns / 1nsmodule dsp_tb;// 输入reg CLK;reg CE;reg SCLR;reg signed [26:0] A, D;reg signed [17:0] B;// 输出wire signed [47:0] P;par…...
【环境配置】Mac电脑安装运行R语言教程 2025年
一、安装 Xcode Command Line Tools 打开终端,输入如下命令: xcode-select --install安装完成后,输入如下命令,能看见版本号说明安装成功 gcc --version二、下载安装R语言 https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 点开后…...
常见算法的总结与实现思路
前言 hello,我是Maybe。昨天和今天花了两天左右的时间。把常见的排序算法都学完了,自己也实现了一遍。感觉收获满满,但是过程是艰辛的。下面我将分享代码和思维导图,希望可以帮助到大家。 思维导图(含注意事项,实现思…...
Ethan独立开发产品日报 | 2025-04-27
1. CreateWise AI 旨在提升你工作效率的AI播客编辑器 人工智能播客编辑器,让你的播客制作速度提升10倍!它可以自动去除口头语和沉默,生成节目笔记和精彩片段,还能一键制作适合社交媒体分享的短视频——所有这些功能都只需一次点…...
5G与边缘计算:协同发展,开启智慧世界新篇章
**5G与边缘计算:协同发展,开启智慧世界新篇章 ** 大家好,我是Echo_Wish。今天我们来探讨一个备受关注的技术话题——5G与边缘计算的协同发展。随着5G网络的逐步普及以及边缘计算技术的快速发展,二者的结合为我们带来了前所未有的创…...
AcWing 885:求组合数 I ← 杨辉三角
【题目来源】 https://www.acwing.com/problem/content/887/ 【题目描述】 给定 n 组询问,每组询问给定两个整数 a,b,请你输出 C(a,b) mod (10^97) 的值。 【输入格式】 第一行包含整数 n。 接下来 n 行,每行包含一组 a 和 b。 …...
Python3:Jupyterlab 安装和配置
Python3:Jupyterlab 安装和配置 Jupyter源于Ipython Notebook项目,是使用Python(也有R、Julia、Node等其他语言的内核)进行代码演示、数据分析、机器学习、可视化、教学的非常好的工具。 最新的基于web的交互式开发环境,适用于n…...
如何搭建spark yarn模式的集合集群
一、环境准备 在搭建 Spark on YARN 集群之前,需要确保以下环境已经准备就绪: 操作系统:推荐使用 CentOS、Ubuntu 等 Linux 发行版。 Java 环境:确保安装了 JDK 1.8 或更高版本。 Hadoop 集群:已经搭建并运行的 Had…...
智能座舱架构中芯片算力评估
在智能座舱(Intelligent Cockpit)领域,芯片的算力是决定系统性能、响应速度以及用户体验的关键因素之一。 随着汽车智能化程度的不断提高,智能座舱对芯片的算力、功耗、集成度以及安全性提出了更高的要求。 智能座舱架构中芯片算…...
STM32完整内存地址空间分配详解
在STM32这类基于ARM Cortex-M的32位微控制器中,整个4GB的地址空间(从0x00000000到0xFFFFFFFF)有着非常系统化的分配方案,每个区域都有其特定的用途。下面我将详细介绍这些地址区域的分配及其功能: STM32完整内存地址空间分配详解(0x00000000…...
叉车司机N1考试的实操部分有哪些注意事项?
叉车司机 N1 考试实操部分分为场地考试和场内道路考试,以下是一些注意事项: 场地考试 起步:检查车辆仪表和个人仪容,穿好工作服、戴安全帽,不穿拖鞋等不符规定的鞋。同时检查换挡和换向操纵杆在空档位置,…...
【行业特化篇2】金融行业简历特化指南:合规性要求与风险控制能力的艺术化呈现
写在最前 作为一个中古程序猿,我有很多自己想做的事情,比如埋头苦干手搓一个低代码数据库设计平台(目前只针对写java的朋友),比如很喜欢帮身边的朋友看看简历,讲讲面试技巧,毕竟工作这么多年,也做到过高管,有很多面人经历,意见还算有用,大家基本都能拿到想要的offe…...
Linux 定时备份到windows 方案比较
1 传输协议比较 特性SCPRSYNCSFTP基本功能文件传输(本地与远程)文件和目录的同步与传输文件管理(上传、下载、删除等)增量传输不支持增量传输支持增量传输不支持增量传输性能传输速度较慢,效率低高效,适合…...
【网络编程】TCP/IP四层模型、MAC和IP
1. TCP/IP的四层模型 网络模型的目的:规范通信标准,确保不同设备和系统之间能够有效通信 对比OSI模型与TCP/IP模型: OSI模型的七层架构(物理层、数据链路层、网络层、传输层、会话层、表示层、应用层)TCP/IP模型的四…...
Java学习手册: IoC 容器与依赖注入
一、IoC 容器概述 IoC(Inversion of Control,控制反转)容器是 Spring 框架的核心组件之一。它负责创建对象、管理对象的生命周期以及对象之间的依赖关系。通过将对象的创建和管理交给 IoC 容器,开发者可以实现代码的松耦合&#…...
Web 基础与Nginx访问统计
目录 Web基础 域名与DNS 域名的结构 网页与HTML 网页概述 HTML 概述 HTML基本标签 1、HTML 语法规则 2、HTML 文件结构 静态网页和动态网页 HTTP协议概述 HTTP方法 HTTP状态码 Nginx访问状态统计 Web基础 域名与DNS 网络是基于 TCP/IP 协议进行通信和连接的,每一台主机都有一…...
了解Android studio 初学者零基础推荐(1)
线上学习课程链接 开发Andorid App 使用的语言有很多,包括java, kotlin,C,等,首先让我们了解kotlin这个热门语言。 kotlin 程序 fun main() {println("hello,xu") } kotlin中的函数定义语法:函数名称在fun关键字后面࿰…...
Android Studio 2024版,前进返回按钮丢失解决
最近升级完AS最新系统后,顶部的前进和返回按钮默认隐藏了 解决方案: 1. 打开settings 2. 找到左侧 Appearance & Behavior 下面点击 Menus and Toolbars 3. 点击 Main Toolar 4. 点击Left,右键选择 Add Actions 5. 弹框中选择 Main Me…...
详解UnityWebRequest类
什么是UnityWebRequest类 UnityWebRequest 是 Unity 引擎中用于处理网络请求的一个强大类,它可以让你在 Unity 项目里方便地与网络资源进行交互,像发送 HTTP 请求、下载文件等操作都能实现。下面会详细介绍 UnityWebRequest 的相关内容。 UnityWebRequ…...
安装qt4.8.7
QT4.8.7安装详细教程(MinGW 4.8.2和QTCreator4.2.0)_qtcreater482-CSDN博客 QT4.8.7安装详细教程(MinGW 4.8.2和QTCreator4.2.0) 1、下载 1)下载QT4.8.7 http://download.qt.io/archive/ 名称:qt-opensource-windows-x86-mingw482…...
2025系统架构师---管道/过滤器架构风格
引言 在分布式系统与数据密集型应用主导技术演进的今天,管道/过滤器架构风格(Pipes and Filters Architecture Style)凭借其数据流驱动、组件解耦与并行处理能力,成为处理复杂数据转换任务的核心范式。从Unix命令…...
仙宫云ComfyUI —【Wan2.1】AI视频生成部署
【Wan2.1】AI视频生成本地部署与使用技巧全面详解_哔哩哔哩_bilibili 所有模型下载:https://pan.quark.cn/s/9d793aa1b258 Runninghub本期课程工作流下载(可获得1000RH币):https://www.runninghub.cn/?utm_sourcekol01-RH145 仙…...
学成在线。。。
一:讲师管理 介绍:可以实现对讲师的分页展示,多条件组合分页查询,对讲师的添加,修改,删除操作。 针对于添加来说,使用requestBody注解,搭配postmapping接收数据,使用service层的对象,调用mapper方法,向数据库中保存数据。 修改: 先根据讲师id,查询出讲师,再去…...
Python爬虫实战:获取猫yan电影网最新热门电影数据并做分析,为51观影做参考
一、引言 随着互联网的迅速发展,电影信息获取更加便捷。猫yan电影作为国内知名电影信息平台,提供了丰富电影数据。对于我们而言,获取并分析这些数据,能为用户提供更有价值的观影建议。本文详细介绍使用 Python 的 Scrapy 框架实现猫yan电影数据爬取与分析,为 “五一” 观…...
将有序数组转换为高度平衡二叉搜索树 | 详解与Java实现
文章目录 1. 问题描述2. 方法思路核心思想:分治法 + 递归3. 代码实现Java实现(含注释)4. 复杂度分析5. 关键点解释为何选择中间节点?为何使用 `left + (right - left) / 2` 而非 `(left + right) / 2`?6. 扩展优化迭代法实现(非递归)优化空间7. 总结1. 问题描述 108.将…...
普推知产:商标驳回复审下初步审定公告了!
近日客户的商标驳回复审后终于下初审公告了,经过一年多时间,当时申请时知道这个商标名称会被驳回,因为有相同一模一样的,客户就想要这个名称,因为与创始人的姓名是相关的,普推知产商标老杨经分析后…...
网工笔记-网络层
概述: 两种观点: 1.面向连接的可靠传输 2.面向无连接的,尽最大努力完成交付数据报服务 虚电路服务(可靠传输) 数据报服务(尽力而为) 两者的对比: 不管是虚电路还是数据报服务都是…...
el-Input输入数字自动转千分位进行展示
el-Input输入数字自动转千分位进行展示,存储值不变 子组件: <template><el-input ref"inputRef" :disabled"disabled" clearable v-model"displayValue" v-bind"$attrs" input"handleInput&quo…...
基于 Spring Boot 瑞吉外卖系统开发(九)
基于 Spring Boot 瑞吉外卖系统开发(九) 保存菜品 菜品管理页面提供了一个“新增菜品”按钮,单击该按钮时,会打开新增菜品页面。 请求路径/dish,请求方法POST,参数使用DishDto类接收。 DishDto 添加f…...
C++复习补充 类型转换和RTTI
类型转换和RTTI 类型转换类与类之间的类型转换四种显示类型转换类型转换注意事项RTTI 类型转换 在 C 中,operator int() 是用户定义的类型转换运算符(User-Defined Conversion Operator),允许自定义对象隐式或显式转换为特定类型…...
QT采用mqtt进行通信(17.1)
文章目录 1.试错历程2. qt5.8安装3. 开始搞了4. 测试连接mqtt broker1.试错历程 尝试过网上说的各种版本,官方库和第三方库,试过qt5.9.9, qt5.12, qt5.12.2, qt5.14 等各个版本,都能编译通过,调用mqtt库,但是都不能连接成功,真的是试吐了,不知道他们的为什么都能成功,…...
基于 BERT 微调一个意图识别(Intent Classification)模型
基于 BERT 微调一个意图识别(Intent Classification)模型,你的意图类别包括: 查询天气获取新闻咨询想听音乐想添加备忘查询备忘获取家政服务结束对话增加音量减小音量其他 具体实现步骤(详细版) 1. 准备你…...
人工智能大语言模型与AI芯片新进展:技术演进与商业化路径
人工智能大语言模型与AI芯片新进展:技术演进与商业化路径 Latest Advances in AI Large Language Models and Chips: Technological Evolution and Commercialization Pathways 一、研究背景与意义(Research Background and Significance) 技…...