Qwen 3技术报告详细解读
近日,Qwen 3系列大模型正式发布,涵盖从0.6B到235B参数的多个规模版本,包括6个Dense模型和2个混合专家(MoE)模型。本文将从模型架构、预训练策略、后训练优化等方面进行全面解读,帮助读者深入理解Qwen 3的技术细节与创新之处。
1 模型架构
1.1 基础架构
Qwen 3延续了Qwen 2.5的核心技术,包括:
-
GQA(Grouped Query Attention) :平衡计算效率和建模能力
-
SwiGLU激活函数:提升非线性表达能力
-
RoPE(Rotary Position Embedding) :增强位置编码效果
1.2 关键改进
相比Qwen 2.5,Qwen 3在注意力机制和MoE架构上进行了优化:
-
QK-Norm取代QKV-bias
-
Qwen 2.5采用QKV-bias来稳定训练,但可能引入偏差
-
Qwen 3改用QK-Norm(Query-Key Normalization),通过归一化提升注意力计算的稳定性
-
实验表明,该方法能有效缓解传统注意力机制的不稳定性问题
-
-
MoE架构优化
-
去除共享专家:Qwen 2.5-MoE包含部分共享专家,而Qwen 3-MoE完全采用独立专家
-
引入Global-Batch Load Balancing Loss
-
-
MoE模型中,不同专家的计算负载可能不均衡
-
该损失函数确保专家间的计算量合理分配,提高训练效率和任务均衡性
1.3 模型规模覆盖
Qwen 3系列包含多种参数规模的模型(0.6B、1.7B、4B、14B、72B、235B及MoE版本),尤其注重小模型的优化(如0.6B、1.7B),以适配边缘设备和移动端应用场景。
2 预训练
2.1 数据规模与多样性
-
总数据量达36T tokens(是Qwen 2.5的两倍)
-
支持119种语言和方言(覆盖范围扩大至Qwen 2.5的三倍)
2.2 三阶段训练策略
阶段详解
-
S1阶段:语言与常识奠基
-
使用大规模通用语料训练基础语言能力
-
采用4k上下文窗口,确保高效训练
-
-
S2阶段:推理能力专项提升
-
引入高质量数学、代码、逻辑推理数据
-
通过课程学习(Curriculum Learning)逐步增加难度
-
-
S3阶段:长上下文扩展
-
扩展序列长度至32k,适应文档理解、长对话等任务
-
采用动态NTK(Neural Tangent Kernel)方法缓解长序列训练的稳定性问题
-
2.3 基座模型性能
基座模型主实验
旗舰模型235B-A22B在大部分数据集上均为SOTA。其他小模型的结果详见下图。
小基座模型实验结果
3 后训练
Qwen 3 后训练流程图
Qwen3的后训练流程涵盖四个阶段,旨在使模型能够在不同模式下执行任务,并在不同任务中表现出色。小模型的性能主要通过蒸馏大模型来提升。
Stage1: Long-CoT冷启动
该阶段构建了一个综合数据集,覆盖数学、编程、逻辑推理及通用STEM问题,每个问题都配有经过验证的参考答案或基于代码的测试用例。
数据构建包括query filtering和response filtering两个阶段。
对于query的过滤,使用 Qwen2.5-72B-Instruct 来识别并剔除那些难以验证的问题,包括:
-
含多个子问题的问题
-
要求生成通用文本的问题
-
那些 Qwen2.5-72B-Instruct 能不依赖 CoT 推理就直接答对的问题。这是想确保仅保留需要深度推理的问题。
此外,还用 Qwen2.5-72B-Instruct 给每个问题标注了所属领域,以保证领域覆盖的广度和平衡性。
对于response的过滤,使用QwQ-32B为每个问题生成 N 个候选response。对于 QwQ-32B 一直无法正确回答的题目,则进行人工标注。
对于通过 Pass@N 的问题,还需进一步筛选,剔除以下类型的response:
-
最终答案错误
-
存在大量重复内容
-
明显是在猜测,没有充分推理过程
-
推理过程与结论不一致
-
存在不恰当的语言混杂或风格突变
-
与评测集样本过于相似
经过严格筛选后,将选出的部分用于模型冷启动sft。这一阶段的目标是灌输基本推理模式,而非追求高性能。所以要尽量保留模型的潜力,便于在之后的强化学习阶段(RL) 进一步提升。为此,建议尽量减少训练样本量和训练步骤,以避免过早收敛。
Stage2: Reasoning RL
该阶段通过强化学习进一步提升模型的推理能力,使用了3,995个query-verifier pairs进行训练。
这些pairs的筛选必须满足以下四个标准:
-
没有用于冷启动阶段
-
适合冷启动后的模型学习:必须是冷启动模型可以理解并且能有效学习的,确保在推理能力上逐步进阶
-
尽可能具有挑战性:能够推动模型的推理能力不断提升,不仅仅是简单任务的重复训练
-
涵盖广泛的子领域:确保模型的全面性
训练技巧上采用了Large Batch Size和High Number of Rollouts per Query,Batch Size调大很好理解,High Number of Rollouts per Query指的一个query会被模型反复推理多次。算法用的GRPO,Qwen3-235B-A22B 模型在 170 个step后,AIME’24 分数从 70.1 提升至 85.1。
Stage3: Thinking Mode Fusion
该阶段的核心目的是将Think模式和No Think模式进行融合,使用户可以通过\think或者\no_think来控制模型是否进入思考模式。
SFT数据构建
SFT使用融合了“think”和“no_think”的数据。其中,think数据 query 来自 Stage 1 的任务,然后用 Stage 2 得到的模型进行拒绝采样生成response;“no_think”数据则覆盖代码、数学、多语言、指令跟随、创意写作、问答、角色扮演等更广泛的任务。为了提升模型对低资源语言的能力,特别提高了翻译任务的比例。
Chat模版设计
用户输入中可通过 /think 或 /no_think 指定模式;默认情况下模型为思维模式。非思维模式下,response中仍保留空的think块() ,以确保格式一致性。多轮对话中,系统会随机插入多个 /think 和 /no_think,让模型学习根据最近一个标签的模式进行回复。
Thinking Budget(思考预算)
无需训练,可以让用户指定思考输出的token长度,当思考token数达到用户指定长度后,直接加上“Considering the limited time by the user, I have to give the solution based on the thinking directly now.\n.\n\n”,强制模型结束思考给出结果。
Stage4: General RL
该阶段旨在全面提升模型在不同任务场景下的能力和稳定性,构建了一个涵盖20多个任务的大规模奖励体系。
每个任务都有定制的评分标准,重点强化以下几个核心能力:
-
指令遵循:确保模型能准确理解并执行用户的要求,包括内容、格式、长度、结构等各类指令。
-
格式遵循:不仅要理解用户显式的指令,还需遵循隐式格式规则,例如正确响应 /think 与 /no think 标记,规范使用和分隔思维内容与最终回答。
-
偏好对齐:对于开放性问题,提升模型的有用性、互动性和表达风格,使回答更符合人类偏好。
-
Agent 能力:训练模型正确调用工具接口,提升作为智能体的执行能力。
-
特殊任务:例如在 RAG(检索增强生成)任务中,引导模型生成更准确且具上下文契合度的回答,降低幻觉风险。
奖励类型包括三类:
-
规则型奖励(Rule-based):适用于推理与格式类任务,通过明确的规则精准判断模型输出是否正确。
-
带参考答案的模型奖励:提供参考答案,用 Qwen2.5-72B-Instruct 来对模型输出进行评分。
-
无参考答案的模型奖励:基于人类偏好数据训练的奖励模型,对模型输出打分。
蒸馏
用于5个dense模型和一个MoE模型。主要是两个阶段:结合教师模型在 /think 和 /no think 两种模式下生成的输出对学生模型进行response蒸馏(数据蒸馏),以及将学生模型的logits与教师模型对齐,以最小化KL散度(logits蒸馏)。
小模型上蒸馏和RL的效果对比
从上图的结果可以看到,在小模型上使用logits蒸馏的效果要优于直接做RL的效果,并且logits蒸馏的GPU Hours仅为RL的1/10。(蒸馏YYDS)
4 结语
Qwen 3的主要改进在于预训练数据的增加和后训练流程的优化,特别是think和no think模式的融合是其亮点。
相关文章:
Qwen 3技术报告详细解读
近日,Qwen 3系列大模型正式发布,涵盖从0.6B到235B参数的多个规模版本,包括6个Dense模型和2个混合专家(MoE)模型。本文将从模型架构、预训练策略、后训练优化等方面进行全面解读,帮助读者深入理解Qwen 3的技…...
leetcode 螺旋矩阵 java
官方还得是官方! class Solution {public List<Integer> spiralOrder(int[][] matrix) {int l 0, r matrix[0].length - 1;int t 0, b matrix.length - 1;int x 0;List<Integer> res new ArrayList<>();while (true) {for (int i l; i …...
Spring Boot 项目中 Redis 存储 Session 对象序列化处理
目录 一、为什么需要序列化处理二、Spring Boot 集成 Redis 存储 Session2.1 添加依赖2.2 配置 Redis 三、自定义序列化和反序列化3.1 创建序列化配置类3.2 测试序列化和反序列化 四、其他序列化方式4.1 使用 JdkSerializationRedisSerializer4.2 使用 StringRedisSerializer 五…...
军工与航空航天特种PCB精密制造:猎板如何定义行业技术新标准?
一、军工与航空航天PCB的极限挑战 在低轨卫星载荷、战机航电系统等场景中,特种PCB需同时满足三大核心指标: 极端环境耐受性:工作温度横跨-55℃至200℃,承受20G机械振动与100krad辐射剂量,盐雾腐蚀测试超过50…...
springboot+vue实现鲜花商城系统源码(带用户协同过滤个性化推荐算法)
今天教大家如何设计一个 鲜花商城 , 基于目前主流的技术:前端vue3,后端springboot。学习完这个项目,你将来找工作开发实际项目都会又很大帮助。文章最后部分还带来的项目的部署教程。 系统有着基于用户的协同过滤推荐算法,还有保证…...
MyBatis 关联映射与多表查询实战教程
一、关联查询基础 1. 连接类型与选择 LEFT JOIN(左连接)SELECT u.*, r.role_name FROM User u LEFT JOIN user_role ur ON u.id = ur.uid LEFT JOIN Role r ON ur.rid = r.id;- **规则**:以左表为主,保留左表所有记录,右表无匹配时填充`NULL`。 - **场景**:查询主体…...
【AI流程应用】智能知识库搭建与实战应用
JeecgBoot 平台的 AIGC 功能模块,是一套类似 Dify 的 AIGC应用开发平台 知识库问答 子系统,是一款基于 LLM 大语言模型 AI 应用平台和 RAG 的知识库问答系统。 其直观的界面结合了 AI 流程编排、RAG 管道、知识库管理、模型管理、对接向量库、实时运行可…...
微店平台店铺商品接口开发指南
微店API获取店铺所有商品实现方案 以下是使用微店开放平台API获取店铺所有商品的完整实现代码,包含请求封装、分页处理和错误处理机制。 点击获取key和secret from weidian_api import WeidianAPI # 配置你的微店应用凭证 APP_KEY "your_app_key" APP_…...
springboot3+vue3融合项目实战-大事件文章管理系统-更新文章分类和增加文章分类优化-分组校验
因为我们之前在category实体类里面增加了notnull注解,而之前新增文章分类模块新增文章是不需要id的,而id是由数据库自动分配的,这就导致不能新增文章了,所以我们要进行分组校验 思路如下: 我们更改category代码&…...
Vue.js教学第九章:Vue动态与异步组件,高效开发全攻略
Vue 组件的动态与异步:探索高效开发路径 在 Vue.js 开发领域中,组件的动态与异步加载机制是构建复杂且高性能前端应用的关键策略。本研究深入探究 Vue 中动态组件与异步组件的原理、用法及性能优化实践,旨在为开发者提供全面且深入的技术指引,助力其在实际项目中高效运用。…...
CVE-2018-1270源码分析与漏洞复现(spring-messaging 表达式注入)
漏洞概述 CVE-2018-1270 是 Spring 框架中的一个高危远程代码执行(RCE)漏洞,影响版本为 Spring Framework 5.0–5.0.4 和 4.3–4.3.14。攻击者通过构造包含恶意 SpEL(Spring Expression Language)表达式的 STOMP&…...
DevOps学习回顾03-ops三部曲之配置管理(CM)
快速回顾 Ops 中配置管理的一些常见的方式,以及一些配置文件常见的组织形式 参考来源 极客时间-全栈工程师修炼指南-OPS三部曲之配置管理 什么是配置管理?–IBM 五大最流行的配置管理工具 为啥需要配置管理? CM 的主要目标是控制复杂系统…...
二进制编码、定点数与浮点数
1. 二进制编码 1.1. 字符串的表示,从编码到数字 不仅数值可以用二进制表示,字符乃至更多的信息都能用二进制表示。最典型的例子就是字符串(Character String)。最早计算机只需要使用英文字符,加上数字和一些特殊符号…...
CentOS:搭建国内软件repository,以实现自动yum网络安装
centosgit仓库_寂寞沙冷州的技术博客_51CTO博客 yum 很慢 centos yum安装慢_mob64ca1417b0c6的技术博客_51CTO博客 yum配置,文件,命令详解-CSDN博客 yum仓库简介_yum库是什么-CSDN博客 rootwww:/etc/yum.repos.d# pwd /etc/yum.repos.d ###创建下面这个.…...
C# AOP编程
AOP(面向切片编程的概念我这里就不介绍了,这里先介绍一下C#中的AOP编程框架。 1.AOP的分类 .net下支持AOP的框架很多,搜了一下有:PostSharp、AspectInjector、Fody 、Castle Windsor、Spring.NET、Ninject、Unity等,实现的方式主要…...
【Element UI排序】JavaScript 的表格排序sortable=“custom“和 @sort-change
目录 一、elementUI排序功能实际案例二、 实例2三、 实例3 Sortable — 是一个 JavaScript 库,用于在现代浏览器和触摸设备上对拖放列表进行重新排序。 一、elementUI排序功能实际案例 表格每一项中加上sortable,可以展示排序的小图标。 在列中设置so…...
使用Jenkins部署nodejs前端项目
1. 安装node环境 1.1 下载 https://nodejs.org/zh-cn/download 1.2 解压到安装目录 tar -xJvf node-v22.15.1-linux-x64.tar.xz mv node-v22.15.1-linux-x64 /home/soft/ mv node-v22.15.1-linux-x64/ node22原本计划安装 node22和node18,但是CentOS7.9 GLIBCXX …...
阿里云域名 绑定 华为云服务器ip
阿里云(万网)域名转入华为云域名图文教程 上-云社区-华为云 阿里云(万网)域名转入华为云域名图文教程-云社区-华为云 在阿里云备案了域名,解析到华为云服务器,不在同一个服务商这样可以使用么?…...
在局域网(LAN)中查看设备的 IP 地址
在局域网(LAN)中查看设备的 IP 地址,可以使用以下几种方法: 方法 1:使用 ipconfig(Windows) 1. 打开 CMD: 按 Win R,输入 cmd,回车。 2. 输入命令&#…...
第3周作业-1层隐藏层的神经网络分类二维数据
文章目录 ***1层隐藏层的神经网络分类二维数据***1. 导入包2. 数据集2.1 导入数据集2.2 查看数据集图案2.3 查看数据集维度 3. Logistic回归3.1 Logistic回归简介3.2 Logistic回归模型3.3 绘制边界 4. 神经网络模型4.1 神经网络简介4.2 神经网络数学模型4.3 建立神经网络方法4.…...
中天智能装备科技有限公司:智能仓储领域的卓越之选
在仓储智能化转型的时代浪潮中,中天智能装备科技有限公司以深厚的技术积淀与创新实力,成为众多企业迈向高效仓储的理想合作伙伴。无论是自动化立体库的精准搭建,还是 AGV 系统的智能部署,中天都以专业姿态为行业树立标杆。 硬核…...
Linux nbd 网络块设备(2)-内核实现
Linux nbd网络块设备(2)-内核实现 关注我,一起学习吧,后续持续更新内核相关 1. 概述: 内核linux/drivers/block/nbd.c 是nbd 网络设备的底层驱动实现逻辑。本文主要介绍nbd 设备注册及I/O请求的处理逻辑。 2. nbd 设备的初始化࿱…...
Python输出与输入
White graces:个人主页 🙉专栏推荐:Java入门知识🙉 🐹今日诗词:吟怀未许老重阳,霜雪无端入鬓长🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 ⛳️点赞 ☀️收藏⭐️关注Ǵ…...
【C语言】复习~数组和指针
数组和指针 1.字符指针 char* 使用方法一: 使用方法二: 这里本质上是把常量字符串的首地址放到了指针变量pstr里面 看下面的面试题 str3和str4指向的是同一个常量字符串,c/c会把常量字符串存储到一个单独的内存区域, 当几…...
rocketmq优先级控制 + 并发度控制
背景 最近在做大模型的项目,算法部门提供的文档解析接口, 并发度为1, 业务这边需要在ai问答和上传文档时进行解析和向量化,文档解析只能单线程跑,问答的文档解析需要高优先级处理。 采用 rocketmq 做文档上传和解析的…...
从0开始学linux韦东山教程第四章问题小结(2)
本人从0开始学习linux,使用的是韦东山的教程,在跟着课程学习的情况下的所遇到的问题的总结,理论虽枯燥但是是基础。说实在的越看视频越感觉他讲的有点乱后续将以他的新版PDF手册为中心,视频作为辅助理解的工具。参考手册为嵌入式Linux应用开发…...
洛谷P1226 【模板】快速幂
题目来源 P1226 【模板】快速幂 - 洛谷 题目描述 给你三个整数 a,b,p,求 abmodp。 输入格式 输入只有一行三个整数,分别代表 a,b,p。 输出格式 输出一行一个字符串 a^b mod ps,其中 a,b,p 分别为题目给定的值, s 为运算结果…...
自动点焊机:在多类电池生产中筑牢质量与效率根基
在电池制造产业飞速发展的当下,焊接作为电池组装的关键环节,其质量与效率直接影响着电池的性能与安全性。自动点焊机凭借其高效、精准、稳定的特性,在电动工具电池、扭扭车电池、储能电池包、滑板车电池以及电动车电池等多个电池制造领域大放…...
信息系统项目管理师考前练习1
以下是结合《信息系统项目管理师教程》(第5版)核心考点和当前行业热点的20道选择题押题,涵盖重点知识和新兴趋势,供考前冲刺练习: 项目生命周期模型选择 在敏捷开发项目中,客户需求频繁变更,且团队希望快速交付最小可行产品(MVP),最适合采用的生命周期模型是: A. …...
C++ for QWidget:正则表达式和QRegExp
正则表达式 正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。以下是对正则表达式的详细介绍: 一、定义与作用 正则表达式是一种文…...
day019-特殊符号、正则表达式与三剑客
文章目录 1. 磁盘空间不足-排查流程2. 李导推荐书籍2.1 大话存储2.2 性能之巅 3. 特殊符号3.1 引号系列(面试题)3.2 重定向符号3.2.1 cat与重定向3.2.2 tr命令:替换字符3.2.3 xargs:参数转换3.2.4 标准全量追加重定向 4. 正则表达…...
学习黑客了解5分钟了解中间人攻击(MITM)
5分钟了解中间人攻击(MITM)🕵️♂️ 什么是中间人攻击(Man-in-the-Middle, MITM)? 中间人攻击是一种网络攻击方式,攻击者悄无声息地“夹在”通信两端之间,偷偷读取、篡改、伪造或…...
亚马逊第四个机器人中心将如何降低30%配送成本?
近年来,亚马逊越来越依赖自动化技术来提升仓储效率和配送速度。2024年,亚马逊宣布其全球第四个机器人中心在美国正式投入运营,这一中心将成为改变供应链策略的新变量。据亚马逊官方消息,这一机器人中心有望帮助公司进一步削减运营…...
「AR智慧应急」新时代:当AR眼镜遇上智能监控,打造立体化应急指挥系统
引言:应急管理的未来已来 数字化浪潮正重塑应急管理领域。传统监控系统依赖固定屏幕、被动告警的短板,在复杂突发事件中暴露无遗。而AR眼镜视频监控管理平台应急应急管理平台的三维融合,正开启"上帝视角"指挥时代——通过虚实叠加…...
docker 启动一个python环境的项目
安装镜像 docker pull python:3.8-slim8902端口 启动容器 tail -f /dev/null 持续监听空文件,保持容器活跃 docker run -it \-p 8902:8902 \--name api_mock2 \-v /home/py/test:/app \-w /app \python:3.8-slim \tail -f /dev/null进入容器 docker exec -it api…...
Docker run命令-p参数详解
端口映射基础语法 docker run -p <宿主机端口>:<容器端口> 操作示例 docker run -d --restartalways --namespug -p 5000:80 registry.aliyuncs.com/openspug/spug参数解析 -d:后台运行容器--restartalways:设置容器自动重启--namespug&…...
vue3请求设置responseType: ‘blob‘,导致失败后获取不到返回信息
vue3请求设置responseType: ‘blob’,导致失败后获取不到返回信息 使用FileReader解决 dataCollect().downloadAll(data).then((res: any) > {if (res.type application/json) {const fileReader new FileReader();fileReader.readAsText(new Blob([res], { type: applica…...
在 Windows 系统部署对冲基金分析工具 ai-hedge-fund 的笔记
#工作记录 一、环境准备 在部署对冲基金分析工具ai-hedge-fund前,需提前安装好必备软件,为后续工作搭建好基础环境。 1. 安装 Anaconda Anaconda 集成了 Python 及众多科学计算库,是项目运行的重要基础。从Anaconda 官方网站下载适合 Win…...
基于python的机器学习(八)—— 评估算法(一)
目录 一、机器学习评估的基本概念 1.1 评估的定义与目标 1.2 常见评估指标 1.3 训练集、验证集与测试集的划分 二、分离数据集 2.1 分离训练数据集和评估数据集 2.2 k折交叉验证分离 2.3 弃一交叉验证分离 2.4 重复随机评估和训练数据集分离 三、交叉验证技术 3.…...
广东省省考备考(第十六天5.21)—言语:语句排序题(听课后强化)
错题 解析 对比选项,确定首句。①句介绍目前人类可以利用一些技术手段进入元宇宙,凭借网络重新定义自己,体验一种全新的生活,②句介绍对于多数人来说,首先要弄清楚什么是元宇宙,③句介绍元宇宙是指超越现实…...
什么是实时流数据?核心概念与应用场景解析
在当今数字经济时代,实时流数据正成为企业核心竞争力。金融机构需要实时风控系统在欺诈交易发生的瞬间进行拦截;电商平台需要根据用户实时行为提供个性化推荐;工业物联网需要监控设备状态预防故障。这些场景都要求系统能够“即时感知、即时分…...
计算机视觉与深度学习 | Python实现CEEMDAN-ABC-VMD-DBO-CNN-LSTM时间序列预测(完整源码和数据)
以下是一个结合CEEMDAN、ABC优化VMD、DBO优化CNN-LSTM的完整时间序列预测实现方案。该方案包含完整的数据生成、算法实现和模型构建代码。 完整实现代码 import numpy as np import pandas as pd from PyEMD import CEEMDAN from vmdpy import VMD from sklearn.preprocessing…...
每日Prompt:实物与手绘涂鸦创意广告
提示词 一则简约且富有创意的广告,设置在纯白背景上。 一个真实的 [真实物体] 与手绘黑色墨水涂鸦相结合,线条松散而俏皮。涂鸦描绘了:[涂鸦概念及交互:以巧妙、富有想象力的方式与物体互动]。在顶部或中部加入粗体黑色 [广告文案…...
期刊采编系统安装升级错误
我们以ojs系统为例: PHP Fatal error: Uncaught Error: Call to a member function getId() on null in /esci/data/html/classes/install/Upgrade.inc.php:1019 Stacktrace: #0 /esci/data/html/lib/pkp/classes/install/Installer.inc.php(415): Upgrade->con…...
【linux命令】git命令简单使用
git命令简单使用 1. 将代码下载到到本地2. 查看分支是否正确3. 将工作目录中的变更添加到暂存区,为下一次提交做准备4. 提交更改,添加提交信息5. 将本地的提交推送到远程仓库6.从远端仓库拉取分支代码7.查看修改日志8. 解决冲突 1. 将代码下载到到本地 …...
使用Tkinter写一个发送kafka消息的工具
文章目录 背景工具界面展示功能代码讲解运行环境创建GUI程序搭建前端样式编写功能实现代码 背景 公司是做AR实景产品的,近几年无人机特别的火,一来公司比较关注低空经济这个新型领域,二来很多政企、事业单位都采购了无人机用于日常工作。那么…...
【VS2017】cpp文件字符编码异常导致编译报错
这是一个 wav 转 pcm 的简单demo,但VS2017编译报错 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <inttypes.h> #pragma pack(push, 1) struct TWavHead {int8_t riff[4]; /*!< (4)资源交换文件标志 RIFF */uint32_t file_si…...
Vue3 中 Route 与 Router 的区别
在 Vue Router 中,Route 和 Router 是两个相关但完全不同的概念: 1、Router (路由实例) 定义:Router 是路由器的实例,负责整个应用的路由管理 功能: 管理路由映射表(路由配置) 提供编程式导航…...
gcc还会有自己的头文件呢?
1. GCC自己的头文件目录 路径: .../lib/gcc/<target>/<version>/include 作用: 这里存放的是GCC编译器自身实现的一些头文件,比如 stdarg.h、float.h、limits.h、varargs.h 等。这些头文件是C/C标准规定必须有的,但…...
YOLO训练输入尺寸代表什么 --input_width 和 --input_height 参数
参数作用 硬件对齐要求 许多边缘计算芯片(如 K230)的 NPU 对输入尺寸有 内存对齐要求(例如 32 的倍数)。脚本会自动将你填写的输入尺寸向上对齐到最近的 32 倍数: input_width int(math.ceil(args.input_width / 32.0…...