公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。
但近年来,推理效率已成为模型部署和性能的关键限制因素。
基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。
该系列包括三个模型规模:Nano(8B)、Super(49B)与 Ultra(253B),另有独立变体 UltraLong(8B,支持超长上下文)。
这一系列模型可不简单,不仅具备超强的推理能力,还为企业使用提供开放许可。模型权重和部分训练数据在 Hugging Face 上公开,遵循 NVIDIA Open Model License 和 Llama 社区许可,可商业使用。
Llama-Nemotron 系列模型是首批支持动态推理切换的开源模型,用户在推理时可在标准聊天模式和推理模式之间自由切换,极大地提升了交互的灵活性。
研究主要是利用推理类和非推理类这两类基准测试对 Llama-Nemotron 系列模型进行评估,结果发现 Llama-Nemotron 系列模型在不同规模下都展现出了良好的性能,尤其是 LN-Ultra 模型与 DeepSeek-R1 相比,极大地提高了推理吞吐量和部署效率。
立即加入私密群 🔥获取《面试手册》 💬参与每日话题讨论 📚解锁更多面试真题解析
** 绿泡泡:秃头123.com** (私信暗号:** 架构升级** 优先通过)Llama-Nemotron 通过多阶段后训练流程,强化推理和非推理任务表现。监督微调阶段专注于数学、代码、推理和工具调用任务;强化学习阶段则采用 REINFORCE 算法(RLOO)及支持在线奖励感知偏好优化的 RPO(Online Reward-aware Preference Optimization)方法,优化对话生成与指令跟随等技能。
Qwen 与 DeepSeek-R1 也在 Llama-Nemotron 的训练中扮演关键角色。Qwen(如 Qwen2.5-32B-Instruct)负责数学和科学数据的生成、分类及去污染,构建高质量训练集;DeepSeek-R1 作为核心教师模型,生成多步推理和代码解决方案,通过监督微调和强化学习将深度逻辑能力迁移到目标模型中。
想知道英伟达具体是如何构建 Llama-Nemotron 系列模型的吗?它背后有着怎样独特的训练方法?
接下来让我们深入探究一下其背后的奥秘。
构建面向推理优化的模型
LN-Super 和 LN-Ultra 模型通过 Puzzle 框架实现高效推理优化。Puzzle 是一个神经网络架构搜索(Neural Architecture Search, NAS)框架,能够在真实部署约束条件下,将大型语言模型转化为面向硬件高效的变体,如图 3 所示。
以 Llama 3 Instruct 模型为起点(LN-Super 基于 Llama 3.3-70B-Instruct,LN-Ultra 基于 Llama 3.1-405B-Instruct),Puzzle 通过逐模块局部蒸馏(block-wise local distillation)方法构建可替代的 Transformer 模块库。每个模块独立训练且可并行处理,旨在接近原始模块功能的同时提升计算性能。
该方法允许每个替代模块在精度与效率之间进行权衡,即模块库中某些变体具有更高的计算效率,但可能伴随一定的准确性下降,从而形成一种显式的精度–效率权衡(accuracy-efficiency tradeoff)。模块变体主要包括以下几种类型:
移除注意力机制(Attention removal):部分模块完全省略注意力机制,从而显著减少计算开销和 KV 缓存(Key-Value cache)内存占用。
可变 FFN 维度(Variable FFN dimensions):通过调整前馈网络(Feed-Forward Network, FFN)的中间维度,能够在不同粒度下实现模型压缩(如将隐藏层维度压缩至原始的 87%、75%、50%,甚至低至 10%)。
尽管 Puzzle 同样支持其他结构替换方式(如多组查询注意力机制(Grouped-Query Attention, GQA)中不同的键值头数、线性注意力替代方案、以及不执行操作的替换模块),但实际评估结果表明,在优化 LN-Super 和 LN-Ultra 两个模型的总体吞吐量与内存节省方面,最有效的技术仍是移除注意力机制与 FFN 压缩。
在模块库构建完成后,Puzzle 通过逐层选取模块的方式组装完整模型。模块选择过程由整数混合规划(Mixed-Integer Programming, MIP)求解器控制,该求解器会在给定的约束条件下(如硬件兼容性、最大推理延迟、总内存预算或指定推理吞吐量)确定效率最优的模块配置。
由于每一层支持多个具有不同精确度–效率权衡方案的模块变体,Puzzle 允许用户精确定位至任何位于精度 - 效率帕累托前沿(Pareto frontier)上的模型配置点。例如,Puzzle 可生成满足特定智能体系统(agentic systems)或部署流程所需约束(如内存不可超出上限或端到端响应时间严格受限)的模型。
FFN 融合实现纵向压缩(Vertical Compression with FFN Fusion): 针对 LN-Ultra 模型,研究者引入了一种额外的压缩技术 ——FFN 融合(FFN Fusion),该方法旨在降低模型的序列深度,并进一步缩短推理延迟。
该方法利用 Puzzle 移除部分注意力层后的结构特性:在这种结构下,模型中经常会出现连续的 FFN 模块序列。FFN Fusion 会识别出这类序列,并将其替换为更少但更宽的 FFN 层,这些宽层可并行执行,从而减少序列处理步骤的数量,同时保留模型的表达能力。
此外,这种方式显著提升了计算资源的利用率,特别是在多 GPU 环境中,可以有效降低跨层通信带来的开销。
部署约束与效率目标
LN-Super 专为在单块 NVIDIA H100 GPU 上高效运行而设计,采用张量并行系数为 1(Tensor Parallelism 1,TP1)的配置。通过 Puzzle 框架优化后,该模型在批量大小为 256、TP1 配置下,相较于 Llama 3.3-70B-Instruct 实现了 5 倍推理吞吐提升。即使在 Llama 3.3-70B-Instruct 使用其最佳配置(张量并行度为 4,TP4)的情况下,LN-Super 在 TP1 条件下仍保持 ≥2.17× 的吞吐优势。
LN-Super 设计满足约 30 万个缓存 Token(cached tokens)的运行约束(等于 batch size × sequence length),基于 FP8 精度在单张 H100 GPU 上测得。例如,batch size 为 16、序列长度为 18,750 的配置即可满足该缓存量要求。
LN-Ultra 的优化目标为整个 H100 节点(8 张 GPU)。在 Puzzle 结构搜索阶段,模型受到推理延迟需至少比 Llama 3.1-405B-Instruct 缩短 1.5 倍的约束。应用 FFN 融合(FFN Fusion)后,最终模型在延迟上实现了 1.71 倍提升。
LN-Ultra 同样受缓存 Token 限制:在 FP8 精度下支持最多 300 万个 Token,在 BF16 精度下支持 60 万个 Token,均以整个 H100 节点为计算基准。
图 4 展示了两种设置下 GPQA-Diamond 准确率(%)与处理吞吐量(Token/s)的权衡曲线。值得注意的是,LN-Ultra 在准确率和效率方面均优于 DeepSeek-R1 和 Llama 3.1-405B,表明在精度 - 吞吐率帕累托曲线(accuracy-throughput Pareto curve)上,LN-Ultra 是更具优势的选择。
NAS 后训练阶段:知识蒸馏与持续预训练
在神经架构搜索(NAS)阶段结束后,为提升模块间兼容性并弥补模块替换带来的质量损失,LN-Super 和 LN-Ultra 均进行了进一步训练。
- LN-Super 使用 Bercovich 等人提出的 Distillation Mix 数据集,以知识蒸馏目标函数训练了 400 亿个 Token;
- LN-Ultra 首先使用相同的蒸馏数据集进行了 650 亿 Token 的蒸馏训练,随后在 Nemotron-H 第四阶段预训练数据集上进行了额外 880 亿 Token 的持续预训练。
通过这一最终的预训练阶段,LN-Ultra 不仅实现了与基准模型 Llama 3.1-405B-Instruct 相当的性能,还在多个关键基准测试上取得超越,验证了即使进行激进的架构优化,也可通过短周期的蒸馏与预训练恢复并提升模型性能(见表 1)。
推理能力强化学习
为了使模型具备在不同任务场景下灵活切换推理深度与回答风格的能力,研究者设计了「detailed thinking on/off」指令机制,通过在合成数据中显式标记是否需要展开详细推理过程,引导模型在训练中学习何时进行逐步思考、展示推理链条,何时直接给出简明答案。
具体而言,指令为「on」时,模型输出完整的中间推理过程并展示解题思路;指令为「off」时,模型仅呈现最终结果。这一机制提升了模型对用户指令的响应可控性,同时增强了推理行为在不同场景中的适应性,使模型能根据实际需求调整输出风格。
在此基础上,模型通过监督微调(SFT)从教师模型中学习多步推理路径,并有效融合推理与通用任务风格,构建了兼具推理精度与使用灵活性的响应系统。
LN-Ultra 在推理类与非推理类基准测试上均达到或超越了现有开源权重模型的水平(如表 5 所示),证明通过从强大教师模型中蒸馏知识,模型可通过监督微调获得较强能力。
然而,蒸馏在本质上为学生模型设定了性能上限,特别是当学生模型本身能力不超过教师模型时。
例如,通过监督微调,LN-Ultra 可逼近 DeepSeek-R1 的性能,但难以超越。为使学生模型有机会超过教师模型,大规模强化学习(RL)提供了可行路径,因其能持续探索新策略并促进模型自学习。
研究者初步实验表明,在小型模型上应用强化学习的性能通常不及直接蒸馏。考虑到资源限制,研究者仅对 LN-Ultra 应用推理方向的强化学习,从而获得一个超越其教师模型的最终版本。
训练流程
针对 LN-Ultra,研究者通过大规模强化学习提升其科学推理能力,采用 GRPO 算法。训练中设置每个 rollout 的提示词长度为 72,并为每个提示采样 16 个响应,采样参数为 temperature = 1,top_p = 1。
全局 batch size 设置为 576,每个 rollout 更新两次梯度,训练持续至模型在推理任务上收敛。图 5 展示了模型在 GPQA-Diamond 上的准确率随训练进展的变化。借助优化后的训练基础设施,整个训练过程共消耗约 14 万张 H100 GPU 小时。
本阶段训练使用以下两类奖励信号:
准确率奖励(Accuracy rewards):每个训练样本提供标准答案(数字、句子或段落),研究者使用 Llama-3.3-70B-Instruct 模型判定策略模型响应是否与标准答案一致。
格式奖励(Format rewards):遵循 DeepSeek-AI 等人做法,在模型开启详细思考(detailed thinking on)模式时,需将推理过程置于 “” 标签之中;而在 detailed thinking off 模式下,确保不包含思考标签。格式奖励确保模型按规定格式输出推理过程。
为增加训练挑战性,研究者对数据进行预处理:由 LN-Super 为每道题生成 8 个独立回答,计算通过率(pass rate),并过滤通过率 ≥0.75 的样本,提升总体训练数据难度。
除数据筛选外,研究者发现课程化学习(curriculum learning)策略能显著帮助模型在复杂推理问题上的收敛和泛化。研究者采用渐进式批处理策略(progressive batching),使用预计算通过率作为样本难度指标,在固定 batch size 下,动态计算每个批次的目标难度分布。
该分布以高斯函数建模,从早期批次集中在高通过率(简单样本),逐步过渡至后期批次的低通过率(高难度样本)。每个 batch 中,样本按目标分布随机分配,并根据不同通过率池中剩余样本量进行容量填充。
这种策略确保样本难度在 batch 层面逐步递进,同时 batch 内部保持随机性。图 6 展示了该课程式学习策略在降低方差、稳定训练过程及提升准确率方面的有效性。
FP8 精度生成阶段
研究者识别出生成阶段是推理过程中的主要限制因素。为提升该阶段性能,研究者开发了支持 vLLM 框架下在线 FP8 精度生成模式的路径,此模式可在 FP8 精度下执行全部矩阵乘(GEMM)操作,并结合每 token 激活缩放因子及每张量权重缩放因子。
为配合训练时输出的 BF16 权重,研究者开发自定义 vLLM 权重加载器,可在运行时将 BF16 权重转换为 FP8 格式及其缩放参数。由于 vLLM 当前不支持 FP8 模式直接初始化模型,研究者实现了元权重张量初始化(meta-weight tensor initialization),避免载入完整 BF16 推理引擎导致 GPU 显存溢出。
在上述优化下,FP8 模式下单个 GPU 每个 prompt 的生成吞吐量最高可达 32 token/s,相比 BF16 提升 1.8 倍。其中,FP8 本身带来 1.4 倍加速,另外 0.4 倍收益源自内存占用减少,使研究者能够启用 vLLM 的 cudagraph 特性,进一步提升系统性能。
用于偏好优化的强化学习
指令跟随能力优化
在完成科学推理任务的强化学习训练后,研究者对 LN-Super 和 LN-Ultra 开展短周期强化学习训练,优化其指令跟随能力。参照 Zhou 等人提出的验证方案,研究者生成包含 1 至 10 条详细指令的合成提示词用于训练。
在该阶段,研究者采用 RLOO 算法进行不超过 120 步的强化学习训练,使用自定义指令跟随验证器作为奖励函数,训练批大小为 128 条提示。结果表明,此类训练不仅提升了模型在传统指令跟随评测中的表现,也对推理类基准任务产生积极影响。
基于人类反馈的强化学习(RLHF)
研究者使用基于人类反馈的强化学习(RLHF)增强模型的通用协助能力(helpfulness)与多轮聊天能力,同时确保其在其他任务上的表现不被削弱。
如表 4 所示,LN-Super(49B 参数)在 Arena Hard 评测中取得 88.3 的高分,超越了数个专有模型(如 Claude 3.5 Sonnet 和 GPT-4o-2024-05-13)以及规模更大的开源模型如 Llama-3.1-405B-Instruct 和 Mistral-large-2407。
为实现这一目标,研究者采用迭代式在线 RPO(online Reward-Parameterized Optimization)训练方式,在 HelpSteer2 数据集的提示语上最大化 Llama-3.1-Nemotron-70B-Reward 所预测的偏好奖励。
具体训练参数为:学习率 α = 4e-7,KL 散度惩罚项 β = 1e-5,奖励缩放因子 η = 3.0,batch size 为 64,训练 500 步。两轮在线 RPO 后,Arena Hard 分数由 69.1 提升至 88.1。
值得注意的是,该过程在几乎所有基准任务中的表现均有提升,唯独在 IFEval 上略有下降。由于该数据集与奖励模型未专门针对数学、代码、科学或函数调用场景设计,研究者推测 RLHF 有助于模型更好地调动已有知识和技能。
针对 LN-Ultra,研究者延续上述训练流程,但采用 GRPO 算法。对每条提示词,生成 8 个样本响应,并以学习率 3e-7、batch size 为 288、KL 惩罚 β = 1e-3 的配置进行 30 步训练。
对于小模型 LN-Nano,研究者进行了两轮离线 RPO,使用策略内数据(on-policy data)训练。第一轮混合使用包含推理和非推理内容的数据,并配合相应系统提示,目的是提升模型的推理控制能力;第二轮聚焦于提升指令跟随表现,训练数据为模型生成的策略内响应。每轮训练最多进行 400 步,学习率 α = 7e-7,KL 惩罚 β = 3e-2,batch size 为 512。
详细内容请参见原论文。
相关文章:
公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。 但近年来,推理效率已成为模型部署和性能的关键限制因素。 基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta …...
CI/CD面试题及答案
一、CI/CD 基础概念 1. 什么是 CI/CD?CI 和 CD 的区别是什么? 答案: CI(持续集成):开发人员提交代码后,自动构建并运行测试,确保代码集成无冲突。CD(持续交付 / 部署&am…...
解决 Ubuntu DNS 无法解析问题(适用于虚拟机 长期使用)
解决 Ubuntu DNS 无法解析问题 在使用 Ubuntu 虚拟机(尤其是在国内)时,经常会遇到这样的错误: Temporary failure resolving cn.archive.ubuntu.com但是此时又能成功 ping 通 IP,这说明网络是正常的,问题…...
如何通过C# 获取Excel单元格的数据类型
在处理 Excel 文件时,了解单元格的数据类型有助于我们正确地解析和处理数据。Free Spire.XLS 是一款功能强大且免费的.NET 组件,支持高效地操作 Excel 文件,包括读取单元格类型。本文将详细介绍如何使用 Free Spire.XLS 来获取 Excel 单元格的…...
Spring Boot初级教程:从零搭建企业级Java应用
一、Spring Boot是什么?为什么学它? 定义:Spring Boot是Spring框架的轻量级快速开发工具,基于“约定优于配置”原则,简化Spring应用的搭建与部署。核心优势: 零配置起步:内置Tomcat/Jetty,无需手动部署Web服务器。自动装配:自动扫描依赖、注入Bean,减少XML/注解冗余代…...
IBM BAW(原BPM升级版)使用教程第六讲
一、事件:Undercover Agent 在 IBM Business Automation Workflow (BAW) 中,Undercover Agent (UCA) 是一个非常独特和强大的概念,旨在实现跨流程或系统的事件处理和触发机制。Undercover Agent 主要用于 事件驱动的流程自动化,它…...
[250509] x-cmd 发布 v0.5.11 beta:x ping 优化、AI 模型新增支持和语言变量调整
目录 X-CMD 发布 v0.5.11 beta📃Changelog🧩 ping🧩 openai🧩 gemini🧩 asdf🧩 mac✅ 升级指南 X-CMD 发布 v0.5.11 beta 📃Changelog 🧩 ping 调整 x ping 默认参数为 bing.com&a…...
Web前端VSCode如何解决打开html页面中文乱码的问题(方法2)
Web前端—VSCode如何解决打开html页面中文乱码的问题(方法2) 1.打开VScode后,依次点击 文件 >> 首选项 >> 设置 2.打开设置后,依次点击 文本编辑器 >> 文件(或在搜索框直接搜索“files.autoGuessEnc…...
打造专属AI好友:小智AI聊天机器人详解
打造专属AI好友:小智AI聊天机器人详解 在当下的科技热潮中,AI正迅速改变着我们的生活,成为了科技领域的新宠。而今,借助开源项目的力量,你可以亲手打造一个智能小助手——小智AI聊天机器人。它不仅是一个技术探索的窗…...
Spring,SpringMVC,SpringBoot,SpringCloud的区别
Spring Spring 是一个基础框架,为 Java 应用提供了 IoC(控制反转)和 AOP(面向切面编程)功能。其主要特点如下: IoC 容器:借助依赖注入,降低了组件间的耦合度。AOP 支持:…...
从投入产出、效率、上手难易度等角度综合对比 pytest 和 unittest 框架
对于选择python作为测试脚本开发的同学来说,pytest和python unittest是必需了解的两个框架。那么他们有什么区别?我们该怎么选?让我们一起来了解一下吧! 我们从投入产出、效率、上手难易度等角度综合对比 pytest 和 unittest 框架…...
无人机电池储存与操作指南
一、正确储存方式 1. 储存电量 保持电池在 40%-60% 电量(单片电压约3.8V-3.85V)存放,避免满电或空电长期储存。 满电存放会加速电解液分解,导致鼓包;**空电**存放可能引发过放(电压低于3.0V/片会永久…...
CSS实现图片垂直居中方法
html <div class"footer border-top-row"><div class"footer-row"><span class"footer-row-col01">制单人:{{ printData[pageIndex - 1].rkMaster.makerName}}<img :src"getPersonSignImgSrc(printData[pa…...
多账号管理与自动化中的浏览器指纹对抗方案
多账号管理与自动化中的浏览器指纹对抗方案 在日常的开发工作中,如果你曾涉及自动化脚本、多账号运营、数据抓取,或是在安全研究方向摸爬滚打过,应该对“浏览器指纹识别”这几个字不会陌生。 指纹识别:不是你以为的那种“指纹”…...
[6-1] TIM定时中断 江协科技学习笔记(45个知识点)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 TRGO是“Trigger Output”的缩写,中文意思是“触发输出”。在STM32微控制器中,TRGO是一个非常重要的功能,它允许定时器(Timer)在特定事件发生时输出一个触发信号。这个触发信号可以用…...
Flutter 3.29.3 花屏问题记录
文章目录 Flutter 3.29.3 花屏问题记录问题记录解决尝试解决 Flutter 3.29.3 花屏问题记录 问题记录 flutter版本3.29.3,代码大致为: ShaderMask(shaderCallback: (Rect bounds) {return LinearGradient(begin: Alignment.topCenter,end: Alignment.bo…...
[Windows] 希捷(Seagate)硬盘官方检测工具 - SeaTools(1.4.0.7)
[Windows] 希捷(Seagate)硬盘官方检测工具 - SeaTools 链接:https://pan.xunlei.com/s/VOPpN9A3Tn_rVktEMu6Lg9q9A1?pwdh8rz# 希望能修复好硬盘...
YOLOv8目标检测性能优化:损失函数改进的深度剖析
文章目录 YOLOv8 简介损失函数在 YOLOv8 中的关键作用SlideLoss 的原理与应用原理代码实例 FocalLoss 分类损失函数的优化原理代码实例 SlideLoss 与 FocalLoss 在 YOLOv8 中的协同作用实验结果与分析 YOLOv8 简介 YOLO(You Only Look Once)系列目标检测…...
docker 日志暴露方案 (带权限 还 免费 版本)
接到了一个需求,需求的内容是需要将测试环境的容器暴露给我们的 外包同事,但是又不能将所有的容器都暴露给他们。 一开始,我分别找了 Portainer log-pilot dpanel 它们都拥有非常良好的界面和容器情况可视化。 但,缺点是&am…...
水印云:AI赋能,让图像处理变得简单高效
水印云是一款基于超强AI技术的图像处理工具,提供丰富的图像编辑功能,将复杂的图像处理极简化,真正实现简单高效的图像处理。无论是去除水印、智能抠图、添加水印,还是提升画质,水印云都能轻松应对,满足不同…...
使用 ECharts GL 实现交互式 3D 饼图:技术解析与实践
一、效果概览 本文基于 Vue 3 和 ECharts GL,实现了一个具有以下特性的 3D 饼图: 立体视觉效果:通过参数方程构建 3D 扇形与底座动态交互:支持点击选中(位移效果)和悬停高亮(放大效果ÿ…...
allure生成测试报告(搭配Pytest、allure-pytest)
文章目录 前言allure简介allure安装软件下载安装配置环境变量安装成功验证 allure运行流程allure装饰器函数基本说明装饰器函数使用allure.attach 命令行运行利用allure-pytest生成中间结果json 查看测试报告总览页面每个tab页的说明类别页面测试套图表页面时间刻度功能页面包 …...
一场陟遐自迩的 SwiftUI + CoreData 性能优化之旅(下)
概述 自从 SwiftUI 诞生那天起,我们秃头码农们就仿佛打开了一个全新的撸码世界,再辅以 CoreData 框架的鼎力相助,打造一款持久存储支持的 App 就像探囊取物般的 Easy。 话虽如此,不过 CoreData 虽好,稍不留神也可能会…...
java的输入输出模板(ACM模式)
文章目录 1、前置准备2、普通输入输出API①、输入API②、输出API 3、快速输入输出API①、BufferedReader②、BufferedWriter 案例题目描述代码 面试有时候要acm模式,刷惯leetcode可能会手生不会acm模式,该文直接通过几个题来熟悉java的输入输出模板&…...
浏览器自动化与网络爬虫实战:工具对比与选型指南
浏览器自动化与网络爬虫实战:工具对比与选型指南 摘要 在当今数字化时代,浏览器自动化和网络爬虫技术已成为数据收集与测试的重要工具。本文深入剖析了多种主流浏览器自动化工具和爬虫框架的特点、优缺点及其适用场景,包括 Selenium、Puppe…...
“双非” “退伍” “材料” “学验证” 拿到Dream Offer
大家好,我是2024年路科验证V2X春季班的学员。在春季班的课上完后,觉得自己的基础大部分已经被路科给弥补了,但是很多课程中关于框架的搭建和一些细节还是不够扎实,有所欠缺,于是又重修了秋季班的课程。这两次课程给我的…...
python 上海新闻爬虫, 上观新闻 + 腾讯新闻
1. 起因, 目的: 继续爬上海新闻, 增加新闻来源。昨天写了: 东方网 澎湃新闻今天增加2个来源: 上观新闻 腾讯新闻此时有4个来源,我觉得已经差不多了。 2. 先看效果 3. 过程: 代码 1, 上观新闻 这里也有一个有趣的…...
【LUT技术专题】ECLUT代码解读
目录 原文概要 1. 训练 2. 转表 3. 测试 本文是对ECLUT技术的代码解读,原文解读请看ECLUT。 原文概要 ECLUT通过EC模块增大网络感受野,提升超分效果,实现SRLUT的改进,主要是2个创新点: 提出了一个扩展卷积&…...
Wsl2 网络模式介绍
每个模式说明参考下面连接 使用 WSL 访问网络应用程序 | Microsoft Learn...
项目高压生存指南:科学重构身体与认知系统的抗压算法
引言:压力重构的工程学思维 在项目管理的高压熔炉中,优秀从业者与普通执行者的核心差异不在于抗压能力的高低,而在于是否掌握压力管理的系统化算法。本文摒弃传统的鸡汤式减压建议,从人体工程学、神经科学和认知心理学角度&#…...
Java设计模式之工厂方法模式:从入门到精通
1. 工厂方法模式概述 1.1 定义与核心思想 工厂方法模式(Factory Method Pattern) **定义:**是一种创建型设计模式,它定义了一个用于创建对象的接口,但让子类决定实例化哪一个类。工厂方法使一个类的实例化延迟到其子类。 **核心思想:**工厂模式的核心思想是将对象的创建…...
生成自定义的androidjar文件具体操作
在Androidsdk目录下的platform找到对应的api的android源码包路径,如android-32拷贝里面的android.jar文件到目录,如 C:\Users\xxxxxxx\Desktop\android\new_android_jar,然后解压android.jar到目录new_android_jar下。在编译后的aosp源码中找…...
在一台CentOS服务器上开启多个MySQL服务
1. 创建目录 mkdir -p /data/mysql3307/{data,tmp,logs} # 赋权 chown -R mysql:mysql /data/mysql3307 chmod -R 750 /data/mysql3307 2.修改 /etc/my.cnf ,添加[mysqld3307]实例配置组 [mysqld3307] # MySQL服务的端口 port 3307 # 套接字文件存放路径 socket /…...
相机的方向和位置
如何更好的控制相机按照我们需要来更好的观察我们需要的地貌呢? 使用 // setview瞬间到达指定位置,视角//生成position是天安门的位置var position Cesium.Cartesian3.fromDegrees(116.397428,39.90923,100)viewer.camera.setView({//指定相机位置destination: position, 在…...
云原生架构下的微服务通信机制演进与实践
📝个人主页🌹:慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 一、引言:通信机制是微服务架构的基础 随着软件系统复杂度的提升,“单体架构 → 微服务架构 → 云原生架构”逐步成为企业数字化转型的演进主线。而在微服务架构中,“服务间通信机制”决定了系统的稳定性…...
Git标签删除脚本解析与实践:轻松管理本地与远程标签
Git 标签删除脚本解析与实践:轻松管理本地与远程标签 在 Git 版本控制系统中,标签常用于标记重要的版本节点,方便追溯和管理项目的不同阶段。随着项目的推进,一些旧标签可能不再需要,此时就需要对它们进行清理。本文将通过一个完整的脚本,详细介绍如何删除本地和远程的 …...
5G让媒体传播更快更智能——技术赋能内容新时代
5G让媒体传播更快更智能——技术赋能内容新时代 在5G时代,媒体传播已经不再是传统的“电视纸媒网站”模式,而是演变成超低延迟、高速传输、智能交互的全新生态。无论是直播、短视频、VR/AR内容还是AI驱动的个性化推荐,5G的高速连接能力都在让…...
数字IC前端学习笔记:锁存器的综合
相关阅读 数字IC前端专栏https://blog.csdn.net/weixin_45791458/category_12173698.html?spm1001.2014.3001.5482 锁存器是一种时序逻辑,与寄存器相比面积更小,但它的存在会使静态时序分析(STA)变得更加复杂,因此懂得什么样的设计会综合出…...
Spring Boot快速开发:从零开始搭建一个企业级应用
Spring Boot快速开发:从零开始搭建一个企业级应用 在当今的软件开发领域,Spring Boot已经成为构建企业级应用的首选框架之一。它不仅简化了Spring应用的初始搭建以及开发过程,还提供了许多开箱即用的功能,使得开发者能够快速地构…...
ATH12K驱动框架架构图
ATH12K驱动框架架构图 ATH12K驱动框架架构图(分层描述)I. 顶层架构II. 核心数据结构层次关系III. 主要模块详解1. 核心模块 (Core)2. 硬件抽象层 (HAL)3. 无线管理接口 (WMI)4. 主机目标通信 (HTC)5. 复制引擎 (CE)6. MAC层7. 数据路径 (DP)IV. 关键数据流路径1. 发送数据流 …...
数字信号处理|| 离散序列的基本运算
一、实验目的 (1)进一步了解离散时间序列时域的基本运算。 (2)了解MATLAB语言进行离散序列运算的常用函数,掌握离散序列运算程序的编写方法。 二、实验涉及的MATLAB子函数 (1)find 功能:寻找非零元素的索…...
集成管理工具Gitlab
GitLab 是一个功能强大的开源代码托管和协作平台,集成 GitLab 可以显著提升团队的开发效率。下面我将为你介绍如何集成 GitLab,包括安装配置和基本使用流程。 一、GitLab 安装与配置 GitLab 有多种安装方式,推荐使用官方 Omnibus 包安装&am…...
2025 年数维杯数学建模 C 题完整论文代码模型:清明时节雨纷纷,何处踏青不误春
《2025 年数维杯数学建模 C 题完整论文代码模型》 C题完整论文 一、问题重述 1.1 问题背景 2025 年第十届数维杯大学生数学建模挑战赛 C 题,将我们带入“清明时节雨纷纷,何处踏青不误春”的诗意情境。清明节,这个处于每年 4 月 4 日至 6 …...
2025数维杯数学建模C题完整限量论文:清明时节雨纷纷,何处踏青不误春?
2025数维杯数学建模C题完整限量论文:清明时节雨纷纷,何处踏青不误春? 清明节,在每年 4 月 4 日至 6 日之间,既是自然节气,也是我国重要 的传统节日,承载着中华民族千年的文化记忆与情感寄托。此…...
POSE识别 神经网络
Pose 识别模型介绍 Pose 识别是计算机视觉领域的一个重要研究方向,其目标是从图像或视频中检测出人体的关键点位置,从而估计出人体的姿态。这项技术在许多领域都有广泛的应用,如动作捕捉、人机交互、体育分析、安防监控等。 Pose 识别模型的…...
Missashe高数强化学习笔记(随时更新)
Missashe高数强化学习笔记 说明:这篇笔记用于博主对高数强化课所学进行记录和总结。由于部分内容写在博主的日记博客里,所以博主会不定期将其重新copy到本篇笔记里。 第一章 函数极限连续 第二章 一元函数微分学 第三章 一元函数积分学 第一节 不定…...
如何从极狐GitLab 容器镜像库中删除容器镜像?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 从容器镜像库中删除容器镜像 (BASIC ALL) 您可以从您的容器镜像库中删除容器镜像。 要基于特定标准自动删除容器镜像&#x…...
出现在‘{‘的段错误
今天在运行程序时,程序因段错误退出了,于是使用gdb调试。 部分输出如下: [New Thread 0x7fffc88be6c0 (LWP 47902)] [New Thread 0x7fffc80bd6c0 (LWP 47903)] [New Thread 0x7…...
【C++设计模式之Observer观察者模式】
Observer观察者模式 模式定义动机(Motivation)结构(Structure)应用场景一(气象站)实现步骤1.定义观察者接口2.定义被观察者(主题)接口3.实现具体被观察者对象(气象站)4.实现具体观察者(例如:显示屏)5.main.cpp中使用示例6.输出结果7. 关键点 …...
【软件测试】测试用例的概念与常见测试的模型
目录 一、测试用例的概念 1.1 什么是测试用例 1.2 编写测试用例的目的 1.3 用例设计的编写格式 二、模型 2.1 质量模型 2.2 测试模型 2.2.1 瀑布模型 2.2.2 螺旋模型 2.2.3 V 模型 2.2.4 W模型 2.2.5 增量、迭代模型 2.2.6 敏捷模型 2.2.6.1 敏捷宣言 2.2.6.2 Sc…...