当前位置: 首页 > news >正文

Qwen3 正式发布

2025 年 4 月 29 日,阿里巴巴正式发布新一代通义千问模型 Qwen31。此次发布的 Qwen3 包含多种模型版本,具体如下:

  • MoE 模型:有 Qwen3-235B-A22B(总参数 2350 亿,激活参数 220 亿)和 Qwen3-30B-A3B(总参数 300 亿,激活参数 30 亿)。
  • 密集模型:包括 Qwen3-32B、14B、8B、4B、1.7B、0.6B,均为 Apache 2.0 开源协议。

Qwen3 具有以下特点:

  • 上下文长度:密集模型中,0.6B、1.7B、4B 为 32K,8B 及以上为 128K;MoE 模型均为 128K。
  • 性能表现
    • Qwen3-235B-A22B:在 ArenaHard(95.6)、AIME'24(85.7)、LiveCodeBench v5(70.7)等测试中,优于 DeepSeek - R1、o1、Grok - 3 等模型,仅在 AIME'25(81.5)略低于 Gemini - 2.5 - Pro(86.7)。
    • Qwen3-30B-A3B:在 ArenaHard(91.0)、AIME'24(80.4)等测试中,超越 QwQ - 32B(激活参数为其 10 倍)。
    • Qwen3-4B:性能可与 Qwen2.5 - 72B - Instruct 媲美,如在 ArenaHard 中为 76.6,Qwen2.5 - 72B - Instruct 为 81.2。
  • 优势领域:在编码(如 CodeForces Elo Rating)、数学(AIME 系列)、多语言(MultilF 8 Languages)任务中表现突出。
  • 多语言支持:覆盖 119 种语言和方言,包括印欧语系、汉藏语系、阿拉伯语、日语、韩语等。
  • 增强的代理能力:优化了编码和工具调用能力,推荐搭配 Qwen - Agent 使用,支持 MCP 协议和自定义工具集成。
  • 预训练数据:使用 36 万亿 token,是 Qwen2.5 的 2 倍,涵盖网页、PDF 文档(通过 Qwen2.5 - VL 提取文本),并通过 Qwen2.5 - Math/Code 生成数学和代码合成数据。
  • 架构优化:MoE 模型通过稀疏激活降低计算成本,密集模型参数效率更高,如 Qwen3 - 4B 性能相当于 Qwen2.5 - 72B。

此外,为释放 Qwen3 的强大性能,模力方舟基于昇腾最新发布的 vLLM Ascend v0.8.4rc2 进行适配。英特尔也第一时间深度优化 Qwen3 大模型,助力其在 PC 客户端、边缘计算、智能驾舱等场景的应用。

Qwen3 系列模型包括 2 个 MoE 模型和 6 个 Dense 模型,参数量从 0.6B 到 235B1。其中,Qwen3-235B-A22B 总参数 2350 多亿、激活参数 220 多亿,Qwen3-30B-A3B 总参数 300 亿、激活参数 30 亿。与其他同类型模型相比,情况如下:

  • 与 Llama 3 相比:Llama 3 有 80 亿参数的 Llama 3 8B 和 700 亿参数的 Llama 3 70B7。Qwen3 的参数量覆盖范围更广,从较小的 0.6B 到较大的 235B,包含了多种不同规模的模型,能满足不同场景和需求。而 Llama 3 目前主要是 8B 和 70B 两种参数量规模。
  • 与 Phi-3 相比:微软 Phi-3 系列模型有 Phi-3-mini(3.8B)、Phi-3-small(7B)和 Phi-3-vision(42 亿)等9。Qwen3 在参数量上有更多选择,且有大规模的 235B 模型,而 Phi-3 目前以小模型为主,参数量相对较小。
  • 与 Mistral 相比:Mistral 有 Mistral 7B(70 亿参数)、Mixtral 8x7B(46.7 亿参数)、Mixtral 8x22B(141 亿参数)、Mistral Large 2(123 亿参数)和 Mistral Small 3.1(240 亿参数)等810。Qwen3 的参数量范围更宽,最大参数量 235B 大于 Mistral 系列模型,同时也有多个小参数量模型可与 Mistral 的部分模型对应比较。
  • 与 DeepSeek-R1 等模型相比:Qwen3 旗舰模型 Qwen3-235B-A22B 的总参数量是 DeepSeek-R1 的 1/3 左右,但在代码、数学、通用能力等基准测试中表现出色,超过了 DeepSeek-R1、o1、o3 - mini、Grok - 3 等全球顶尖模型,在部分关键指标上可与 Gemini 2.5 Pro 媲美。

相关文章:

Qwen3 正式发布

2025 年 4 月 29 日,阿里巴巴正式发布新一代通义千问模型 Qwen31。此次发布的 Qwen3 包含多种模型版本,具体如下: MoE 模型:有 Qwen3-235B-A22B(总参数 2350 亿,激活参数 220 亿)和 Qwen3-30B-A…...

[操作系统] 线程互斥

文章目录 背景概念线程互斥的引出互斥量锁的操作初始化 (Initialization)静态初始化动态初始化 加锁 (Locking)阻塞式加锁非阻塞式加锁 (尝试加锁/一般不考虑) 解锁 (Unlocking)销毁 (Destruction)设置属性 (Setting Attributes - 通过 pthread_mutex_init) 锁本身的保护互斥锁…...

KDD 2025 | (8月轮)时间序列(Time Series)论文总结

KDD 2025将在2025年8月3号到7号在加拿大多伦多举行,本文总结了KDD 2025(August Cycle)有关时间序列(Time Series)相关文章,共计11篇,其中1-10为Research Track,11为ADS Track。如有疏漏,欢迎补充…...

Spring MVC @PathVariable 注解怎么用?

我们来详细分析 Spring MVC 中的 PathVariable 注解。 PathVariable 注解的作用 PathVariable 注解用于从 URI 模板(URI Template)中提取值,并将这些值绑定到 Controller 方法的参数上。URI 模板是一种包含占位符的 URL 路径,这…...

PostgreSQL运算符

运算符 算数运算符 运算符描述示例加法SELECT 2 3; 结果为 5-减法SELECT 5 - 2; 结果为 3*乘法SELECT 2 * 3; 结果为 6/除法(对于整数相除,会截断小数部分)SELECT 5 / 2; 结果为 2 ,若要得到精确结果,可使用浮点数 …...

Ocelot与.NETcore7.0部署(基于腾讯云)

资料链接:https://download.csdn.net/download/ly1h1/90731290 1.效果 基于Ocelot,实现对3个微服务的轮询调用,实现不停机更新,无缝更新; 2.环境要求 1.部署环境:腾讯云的轻量化应用服务器 2.系统环境&…...

Umi-OCR项目(1)

最近接触到了一个项目,我在想能不能做出点东西出来。 目标:识别一张带表格的图片,要求非表格内容和表格内容都要识别得很好,并且可视化输出为word文档。 下面是第一步的测试代码,测试是否能够调用ocr能力。 import re…...

前端面试常问问题[From CV]

作为前端面试官,我会针对简历中的技术栈、项目经历和技能细节提出以下20个问题,并附上参考答案: 技术基础类问题 Q:请解释JavaScript事件循环机制,结合宏任务/微任务说明代码执行顺序 A:事件循环分为调用栈…...

C语言学习之动态内存的管理

学完前面的C语言内容后,我们之前给内存开辟空间的方式是这样的。 int val20; char arr[10]{0}; 我们发现这个方式有两个弊端:空间是固定的;同时在声明的时候必须指定数组的长度,一旦确定了大小就不能调整的。 而实际应用的过程中…...

CMake中的“包管理“模块FetchContent

背景介绍 C的包管理工具,好像除了微软家的vcpkg外,并没有一个特别有名的包管理器。 CMake其实也提供了基础的包管理功能。使用 FetchContent 模块系列命令可以下载项目依赖的源代码或者其他文件。 基本用法 FetchContent_Declare命令定义我们下载的内…...

python3基础

Python3 基础教程 1. Python简介 Python是一种高级、解释型、通用的编程语言,由Guido van Rossum于1989年底发明。Python的设计哲学强调代码的可读性和简洁性,其核心理念体现在"Python之禅"中: 优美胜于丑陋(Beautiful is better than ugly) 显式胜于隐式(E…...

课题推荐——通信信号处理中的非线性系统状态估计(如信号跟踪、相位恢复等场景),使用无迹卡尔曼滤波(UKF)的非线性滤波算法,MATLAB实现

给出一个基于无迹卡尔曼滤波(UKF)的非线性滤波算法及其MATLAB实现,适用于通信信号处理中的非线性系统状态估计(如信号跟踪、相位恢复等场景)。该算法结合了非线性动态模型和观测模型,并通过UT变换避免雅可比…...

Postgresql源码(145)优化器nestloop参数化路径评估不准问题分析

相关 《Postgresql源码(133)优化器动态规划生成连接路径的实例分析》 1 问题 最近遇到一个问题,评估行数和真实行数存在较大差距,导致计划不准的问题。 nestloop内表评估是根据外表的参数来的。因为外表驱动表每取一条&#xff…...

【深度学习新浪潮】小米MiMo-7B报告内容浅析

一段话总结 该报告介绍了专为推理任务设计的大语言模型MiMo-7B,其在预训练阶段通过优化数据预处理、采用三阶段数据混合策略(处理约25万亿token)和引入MultiToken Prediction(MTP)目标提升推理潜力;后训练阶段构建13万可验证数学和编程问题数据集,结合测试难度驱动奖励…...

使用Python和Pandas实现的Snowflake权限检查与SQL生成用于IT审计

import snowflake.connector import pandas as pddef get_snowflake_permissions():# 连接Snowflake&#xff08;需要替换实际凭证&#xff09;conn snowflake.connector.connect(user<USER>,password<PASSWORD>,account<ACCOUNT>,warehouse<WAREHOUSE&g…...

spring 从application.properties中获取参数的四种方式

在Spring Boot中&#xff0c;自定义一个Starter时&#xff0c;从application.properties中获取参数主要有以下几种方法&#xff1a; 使用Value注解 这是最常用的方法之一&#xff0c;通过Value注解可以直接将application.properties中的属性值注入到Spring管理的Bean中。 imp…...

react学习笔记2——基于React脚手架与ajax

使用create-react-app创建react应用 react脚手架 xxx脚手架: 用来帮助程序员快速创建一个基于xxx库的模板项目 包含了所有需要的配置&#xff08;语法检查、jsx编译、devServer…&#xff09;下载好了所有相关的依赖可以直接运行一个简单效果 react提供了一个用于创建react项…...

nim模块教程

导入一个模块 如果我们想要导入一个模块&#xff0c;并且和它的所有函数&#xff0c;我们要做的是写import <moduleName>在我们的文件里&#xff0c;这通常是在文件顶部进行的&#xff0c;这样我们就可以很容易地看到我们的代码使用了什么。 创建一个模块 first.nim …...

雅马哈SMT贴片机高效精密制造解析

内容概要 作为电子制造领域的核心装备&#xff0c;雅马哈SMT贴片机通过集成高速运动控制、智能视觉识别与模块化供料三大技术体系&#xff0c;构建了精密电子元件贴装的工业化解决方案。其YSM系列设备在5G通讯模组、汽车电子控制器及智能穿戴设备等场景中&#xff0c;实现了每…...

审计专员简历模板

模板信息 简历范文名称&#xff1a;审计专员简历模板&#xff0c;所属行业&#xff1a;其他 | 职位&#xff0c;模板编号&#xff1a;KSJYVR 专业的个人简历模板&#xff0c;逻辑清晰&#xff0c;排版简洁美观&#xff0c;让你的个人简历显得更专业&#xff0c;找到好工作。希…...

npm宿主依赖、宿主环境依赖(peerDependencies)(指由宿主环境提供的依赖)

文章目录 宿主环境依赖详解基本概念工作原理应用场景插件开发UI组件库 与其他依赖类型对比npm不同版本处理差异npm v3-v6npm v7 实际应用示例React插件开发 解决宿主依赖问题 宿主环境依赖详解 基本概念 宿主环境依赖&#xff08;peerDependencies&#xff09;是指包声明自身…...

Android Kotlin 项目集成 Firebase Cloud Messaging (FCM) 全攻略

Firebase Cloud Messaging (FCM) 是 Google 提供的跨平台消息推送解决方案。以下是在 Android Kotlin 项目中集成 FCM 的详细步骤。 一、前期准备 1. 创建 Firebase 项目 访问 Firebase 控制台点击"添加项目"&#xff0c;按照向导创建新项目项目创建完成后&#x…...

游戏引擎学习第252天:允许编辑调试值

回顾并为今天的工作设定目标 我们处理了调试值&#xff08;debug value&#xff09;的编辑功能。我们希望实现可以在调试界面中编辑某些值&#xff0c;为此还需要做一些额外的工作。 我们的问题在于&#xff1a;当某个调试值被编辑时&#xff0c;我们需要把这个“编辑”的操作…...

支持selenium的chrome driver更新到136.0.7103.49

最近chrome释放新版本&#xff1a;136.0.7103.49 如果运行selenium自动化测试出现以下问题&#xff0c;是需要升级chromedriver才可以解决的。 selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only su…...

cPanelWHM 的 AutoSSL

在 cPanel&WHM 的第58版本中&#xff0c;开始增加了AutoSSL&#xff0c;这是一项非常棒的新功能。 什么是 AutoSSL&#xff1f; AutoSSL 是为了解决每个使用 cPanel&WHM 用户的最大难题&#xff1a;SSL 证书的安装和续期。有了 AutoSSL&#xff0c;这个问题就不再是问…...

MySQL数据同步之Canal讲解

文章目录 1 Canal搭建1.1 简介1.1.1 概述1.1.2 优点1.1.3 作用&核心组件 1.2 搭建 Canal1.2.1 准备工作1.2.1.1 检查配置1.2.1.2 &#xff2d;&#xff59;SQL配置 1.2.2 下载并安装 Canal1.2.3 配置 Canal Server1.2.3.1 全局配置1.2.3.2 实例配置1.2.3.3 配置目标系统1.2…...

完整迁移物理机Windows XP到PVE8

计划对2007年部署的windows_xp_professional _service_pack_2_x86系统主机&#xff0c;进行重新部署&#xff0c;由于确实环境包和软件包&#xff0c;无法从头部署&#xff0c;只能考虑带系统环境迁移。原主机年代台久远&#xff08;1Ghz处理器&#xff0c;1G内存&#xff09;G…...

量子加密通信:打造未来信息安全的“铜墙铁壁”

在数字化时代&#xff0c;信息安全已成为全球关注的焦点。随着量子计算技术的飞速发展&#xff0c;传统的加密算法面临着前所未有的挑战。量子计算机的强大计算能力能够轻易破解现有的加密体系&#xff0c;这使得信息安全领域急需一种全新的加密技术来应对未来的威胁。量子加密…...

11.多边形的三角剖分 (Triangulation) : 画廊问题

目录 1.Methodology ​编辑2. Definition 3. Lower & Upper Bound 4.Hardness 5.Approximation & Classification 6. Necessity of floor(n/3) 1.Methodology 多边形三角剖分 点集三角剖分 2. Definition 假设存在一个艺术馆&#xff0c;里面存在很大艺术品需…...

[蓝桥杯 2023 国 Python B] 划分 Java

import java.util.*;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);int[] arr new int[41];int sum 0;for (int i 1; i < 40; i) {arr[i] sc.nextInt();sum arr[i];}sc.close();int target sum / 2; // 最接近的两…...

计算机网络——HTTP/IP 协议通俗入门详解

HTTP/IP 协议通俗入门详解 一、什么是 HTTP 协议&#xff1f;1. 基本定义2. HTTP 是怎么工作的&#xff1f; 二、HTTP 协议的特点三、HTTPS 是什么&#xff1f;它和 HTTP 有啥区别&#xff1f;1. HTTPS 概述2. HTTP vs HTTPS 四、HTTP 的通信过程步骤详解&#xff1a; 五、常见…...

渗透测试中的那些“水洞”:分析与防御

1. Nginx 版本泄露 风险分析&#xff1a; Nginx 默认会在响应头中返回 Server: nginx/x.x.x&#xff0c;攻击者可利用该信息匹配已知漏洞进行攻击。 防御措施&#xff1a; 修改 nginx.conf 配置文件&#xff0c;隐藏版本信息&#xff1a;server_tokens off;使用 WAF 进行信息…...

攻防世界 - Misc - Level 3 | 3-1

&#x1f31f; 关注这个靶场的其它相关笔记&#xff1a;CTF 靶场笔记 —— 攻防世界&#xff08;XCTF&#xff09; 过关思路合集 0x01&#xff1a;考点速览 本题考察的是 Misc 中的流量分析题&#xff0c;想要通过此关&#xff0c;你需要具备以下技术&#xff1a; 会通过 010 …...

安装linux下的idea

1.有可能传不了文件 2.按这个包里的流程装 通过网盘分享的文件&#xff1a;idea旗下所有产品.txt 链接: https://pan.baidu.com/s/1kHHkW3DB3z3a6CG0qnMkWA?pwdgg3f 提取码: gg3f...

【音频】基础知识

1、原始数据 1)音频信号:声音是一种机械波,经过麦克风等设备转化为电信号,再经过模数转换(ADC)变成数字信号,这个数字信号就是音频信号。 2)音频信号的参数: 采样率:一秒钟内对音频的模拟信号采样的个数; 8000Hz:主要用于电话通信 、满足基本的语音通信需求,同时…...

系统思考:企业效率提升关键

最近在辅导一家企业时&#xff0c;我们一起画出了这张图。老板说&#xff1a;“我每天都在救火&#xff0c;员工效率不高&#xff0c;我只能不断加班加点&#xff0c;亲自盯、亲自跑、亲自上阵……” 但图画出来才发现&#xff0c;问题不是出在员工不够努力&#xff0c;也不是老…...

MySQL 查找指定表名的表的主键

原理 SELECT COLUMN_NAME FROM INFORMATION_SCHEMA.KEY_COLUMN_USAGE WHERE TABLE_NAME 表名 AND CONSTRAINT_NAME PRIMARY方法 public static String getPk(String tableName) {String sql "SELECT COLUMN_NAME FROM INFORMATION_SCHEMA.KEY_COLUMN_USAGE WHERE TA…...

华为eNSP:IS-IS认证

一、什么是IS-IS认证&#xff1f; 华为eNSP中的IS-IS认证 IS-IS认证是华为eNSP网络中用于保障中间系统到中间系统&#xff08;IS-IS&#xff09;协议通信安全性的核心机制&#xff0c;通过身份验证和数据完整性校验防止非法路由信息注入或篡改。其实现方式与关键特性如下&…...

qemu(4) -- qemu-system-arm使用

1. 前言 参考网上的资料&#xff0c;使用qemu中的vexpress_a9板子&#xff0c;跑一下Linux环境。 2. 源码 2.1 u-boot 可以到U-Boot官网下载对应的源码&#xff0c;我下载的是u-boot-2025.04-rc5.tar.gz&#xff0c;大约24MB。 3.2 linux 可以到The Linux Kernel Archive…...

JavaScript基础-递增和递减运算符

在JavaScript编程中&#xff0c;递增()和递减(--)运算符是操作数值变量的快捷方式。它们能够简洁地对变量值进行加一或减一的操作。尽管看似简单&#xff0c;但正确理解这两种运算符的不同使用方式&#xff08;前缀与后缀&#xff09;对于编写高效且无误的代码至关重要。本文将…...

解决Win10虚拟机“网络连接不上”,“Ethernet0 网络电缆被拔出”的问题

一、情景引入 今天用Win10虚拟机打开浏览器发现&#xff1a; 很奇怪&#xff0c;平常都没有这个问题。 二、检查网络状态 点击更改适配器选项&#xff0c;发现如下&#xff1a; 三、解决问题 打开任务管理器&#xff0c;点击服务&#xff0c;搜索栏搜索&#xff1a;VM …...

【Redis】String详细介绍及其应用场景

文章目录 String类型存储方式set命令get命令mset命令mget命令setnx命令setex和psetex命令incr和decr命令系列append命令--raw选项让redis尝试将二进制数据翻译 getrange命令setrange命令strlen命令字符串类型命令小结string内部的编码方式string类型的典型应用场景1.RedisMySQL…...

C++负载均衡远程调用学习之消息路分发机制

目录 1.LARV0.5-TCP_server链接管理的功能实现及测试 2.LARV0.6 3.LARV0.6 4.LARV0.6 5.LARV0.6-tcp_server集成 6.LARV0.6-tcp_server集成消息路由分发机制总结 7.LARV0.6回顾 1.LARV0.5-TCP_server链接管理的功能实现及测试 ### 16.2 完成Lars Reactor V0.12开发 ###…...

实现了一个基于寄存器操作STM32F103C8t6的工程, 并实现对PA1,PA2接LED正极的点灯操作

#include "stm32f10x.h"// 基于寄存器开发的项目了 int main(){RCC->APB2ENR 0x00000004; // 开启时钟GPIOA->CRL 0x00003330; // 配置引脚 // 0011 0011 0000GPIOA->ODR 0x0000000E; // 1110while(1){} }...

Python字典(dict)详解:从创建到操作全掌握

前言 字典是可变容器&#xff0c;可存储任意类型对象 字典以键(key)-值(value)对的形式进行映射&#xff0c;键值对用冒号分割&#xff0c;对之间用逗号分割 d {key1 : value1, key2 : value2, key3 : value3 } 字典的数据是无序的 字典的键只能用不可变类型&#xff0c;且…...

UDP数据包和TCP数据包的区别;网络编程套接字;不同协议的回显服务器

目录 一、UDP 数据包与 TCP 数据包的区别&#xff1a; 连接方面&#xff1a; 传输方面&#xff1a; 面向对象&#xff1a; 双工模式&#xff1a; 二、UDP 网络编程套接字&#xff1b;基于 UDP 协议的回显服务器&#xff1a; 1. UDP 数据报套接字核心类 DatagramSocket &…...

Python 应用异常追踪实战:如何集成 Sentry 进行高效错误监控

Python 应用异常追踪实战:如何集成 Sentry 进行高效错误监控 引言 在现代应用开发中,异常处理和错误监控至关重要。一个小的运行时错误可能会导致整个系统崩溃,而难以发现的逻辑漏洞可能长期影响用户体验。为了提升代码的稳定性,我们需要一个高效的异常监控机制,以便能够…...

【数据结构】--- 双向链表的增删查改

前言&#xff1a; 经过了几个月的漫长岁月&#xff0c;回头时年迈的小编发现&#xff0c;数据结构的内容还没有写博客&#xff0c;于是小编赶紧停下手头的活动&#xff0c;补上博客以洗清身上的罪孽 目录 前言&#xff1a; 概念&#xff1a; 双链表的初始化 双链表的判空 双链表…...

【C语言练习】014. 使用数组作为函数参数

014. 使用数组作为函数参数 014. 使用数组作为函数参数示例1&#xff1a;使用数组作为函数参数并修改数组元素函数定义输出结果 示例2&#xff1a;使用数组作为函数参数并计算数组的平均值函数定义输出结果 示例3&#xff1a;使用二维数组作为函数参数函数定义输出结果 示例4&a…...

本地服务器备份网站数据,本地服务器备份网站的操作步骤

本地服务器备份网站数据的完整操作指南 一、明确备份需求与目标 核心备份对象 网站文件&#xff1a; 上传的媒体文件&#xff08;图片、视频、PDF等&#xff09; 配置文件&#xff08;如.htaccess、wp-config.php&#xff09; 附加内容&#xff08;根据需求选择&#xff…...