当前位置: 首页 > news >正文

Qwen2.5技术报告阅读

论文概述

🧠 1. 模型概述

Qwen2.5 是阿里巴巴推出的一系列大语言模型(LLMs),在 预训练数据量 和 后训练方法 上都比前一代 Qwen2 有了显著提升。

📈 2. 模型特点
• 预训练数据量提升:从 7 万亿 token 提升到 18 万亿 token,覆盖常识、专业知识、数学和编程等。
• 后训练强化:
• 监督微调(SFT):超过 100 万样本。
• 强化学习(RLHF):采用了 DPO(直接偏好优化) 和 GRPO(群体相对策略优化) 两阶段方法。
• 支持多种模型规模:从 0.5B 到 72B 参数不等,含 MoE 混合专家架构的 Turbo/Plus 版本。
• 最长上下文支持:
• 普通模型支持最多 128K tokens
• Turbo 版本支持最多 100 万 tokens

⚙️ 3. 架构细节
• 主干架构:Transformer 解码器 + GQA 注意力 + SwiGLU 激活 + RoPE 位置编码。
• MoE 架构:在 FFN 层引入多个专家并使用 Top-K 路由机制。
• Tokenizer:使用 BBPE,支持多语言,并扩展了 control token 集。

🔧 4. 后训练亮点
• SFT 阶段强化长文本生成、数学推理、代码能力。
• Offline RL:通过高质量响应构建 DPO 训练对。
• Online RL(GRPO):基于 reward model 实时反馈,强化输出质量。

🧪 5. 评估结果
• 在多个领域基准(如 MMLU、GSM8K、MATH、HumanEval 等)上表现强劲。
• Qwen2.5-72B-Instruct 与 GPT-4o、LLaMA-3 等主流模型不相上下,甚至在某些指标上超越。

MOE架构简单介绍

好的,来一份系统清晰的 MoE 架构介绍 ✅
MoE(Mixture of Experts,专家混合架构)是一种稀疏激活的大模型结构设计,核心思想是:

让不同的 token 自动选择最合适的一部分网络来处理,提升模型容量同时减少计算量。

🧠 1. MoE 架构概览图

         ┌──────────────┐

输入 x ──▶│ Router │◀── 每个 token 路由
└─────┬────────┘

┌───────────────┐
│ Expert 1 │
└───────────────┘
┌───────────────┐
│ Expert 2 │
└───────────────┘
… (多个 Experts)

加权融合输出

🔧 2. 架构组件详解

组件 作用
Experts 一组并行的 FFN 子网络,结构一般相同(如 Linear → ReLU → Linear)
Router 决定每个 token 应该使用哪些专家,一般选择 top-k(如 Top-1 或 Top-2)
Gate 给被选中的专家输出分配权重,控制融合方式
输出融合 使用 gate 权重,对专家输出加权求和,作为最终 FFN 输出

📦 3. MoE 的工作流程(Top-2 举例)
1. 输入 token:传入 MoE 层的每个 token
2. Router 计算权重:为每个 token 对所有 Experts 打分
3. 选择 Top-k Experts:如 Top-2 得分最高的专家
4. 激活对应 Experts:只有被选中的专家运行计算(稀疏)
5. Gate 融合输出:专家输出 × 权重 → 加权合并为最终结果

✅ 4. MoE 的优势

优势 描述
🚀 提升模型容量 可以部署千亿/万亿参数模型而不显著增加计算量
⚡ 降低推理成本 每次只激活部分专家,减少了显存和计算需求
🧠 提升任务表达 不同专家可以学习不同任务/风格/语言等能力
🤝 支持并行扩展 在多 GPU 上分布 Expert,更易横向扩展大模型

⚠️ 5. 挑战点

挑战 原因
路由不均衡 Router 学不好时,可能让大部分 token 都选一个 Expert(load imbalance)
通信成本高 多卡训练时,token/专家跨卡,需要大量通信(AllToAll)
难以训练稳定 稀疏梯度传播、负载不均、token 抖动,导致训练不稳定

🔍 6. 实际使用 MoE 的大模型(例子)

模型名称 特点
GPT-4(猜测) 大概率采用 MoE 提高推理效率
Mixtral 开源 Top-2 MoE(12.9B × 8)结构
Qwen2.5-Turbo MoE 架构、支持百万上下文
DeepSeek-VL 多模态大模型,采用 MoE 提升性能

🔚 总结一句话:

MoE 是让模型“按需计算”的架构,每个 token 自动选择专家处理,既聪明又高效,是大模型未来的重要方向。

FFN模块优化点

Transformer 中 FFN(前馈网络)的三种常见优化方式,都是为了提升模型性能、表达力或计算效率👇

🧠 1. SwiGLU:更强的非线性激活

✨ 名字来源:

Swish-Gated Linear Unit

🔧 核心结构:SwiGLU(x) = Linear1(x) ⊗ Swish(Linear2(x))

对比标准 FFN:

# 原始 FFN
FFN(x) = Linear(x) → GELU → Linear
# SwiGLU 结构(乘法门控)
FFN(x) = (xW1) * Swish(xW2) → Linear

✅ 好处:
• 更复杂的门控非线性结构
• 在多种模型中(如 PaLM、Qwen2、LLaMA)效果优于传统 GELU
• 保持训练稳定的同时提升表示力

🧠 2. MoE(Mixture of Experts):稀疏激活专家模型

✨ 思路:

不让 FFN 层一次性全跑,而是只让几个 Expert FFN 被选中执行。

🔧 结构简化:Router(x) → 选出 Top-k Experts → Expert(x) → 加权合并输出

✅ 好处:

点 说明
💥 更大容量 可以有上千亿参数但只激活一小部分
⚡ 更省算力 减少每次计算的激活量(Top-1 或 Top-2)
🧠 学习多种模式 每个 Expert 负责不同任务/语义风格

MoE 是现在 GPT-4、Qwen2.5-Turbo、Mixtral 等大模型普遍使用的结构。

🧠 3. Gate(门控机制):信息加权融合

✨ 结构简化:

FFN(x) = Expert1(x) * w1 + Expert2(x) * w2其中 w1, w2 由 Router 预测得到。

✅ 作用:
• 对多个 Expert 的输出进行加权平均,而不是 hard select(只选一个)
• 保留多个表达路径的好处(更平滑、稳定)
• 避免“选错 expert”导致模型崩塌

这种机制通常和 MoE 搭配使用,叫做 Top-2 Gated MoE

🔍 三种方式对比总结:

优化方式 目标 特点 应用模型
SwiGLU 提升表达 多非线性激活 LLaMA、Qwen2
MoE 提升容量 & 降算力 多专家稀疏激活 GPT-4、DeepSeek、Mixtral
Gate 提升稳定性 加权融合专家输出 Top-2 MoE 架构中常见

✅ 总结一句话:

SwiGLU 让 FFN 更强,MoE 让 FFN 更省,Gate 让 MoE 更稳。

需要我把这三种 FFN 优化方式用图画出来吗?流程图 or 对比图都可以,很直观~

四个结构的详细实现:
1. DenseFFN:标准前馈网络
2. SwiGLUFFN:使用 Swish 和门控机制增强非线性
3. MoEFFN:Top-1 稀疏专家模型
4. MoEGatedFFN:Top-2 路由 + gate 权重融合,更真实的 MoE 实现
代码为虚构代码块。仅供理解使用。

import torch
import torch.nn as nn
import torch.nn.functional as F# 1️⃣ 传统 Dense FFN
class DenseFFN(nn.Module):def __init__(self, hidden_dim=768, ffn_dim=3072):super().__init__()self.ffn = nn.Sequential(nn.Linear(hidden_dim, ffn_dim),nn.ReLU(),nn.Linear(ffn_dim, hidden_dim))def forward(self, x):return self.ffn(x)# 2️⃣ SwiGLU FFN
class SwiGLUFFN(nn.Module):def __init__(self, hidden_dim=768, ffn_dim=3072):super().__init__()# 拆成两个并行 Linear 层(门控结构)self.linear1 = nn.Linear(hidden_dim, ffn_dim)self.linear2 = nn.Linear(hidden_dim, ffn_dim)self.proj = nn.Linear(ffn_dim, hidden_dim)def swish(self, x):return x * torch.sigmoid(x)def forward(self, x):gate = self.swish(self.linear2(x))  # 门控路径value = self.linear1(x)             # 主路径return self.proj(gate * value)# 3️⃣ 简化版 MoE FFN(Top-1 激活)
class MoEFFN(nn.Module):def __init__(self, hidden_dim=768, ffn_dim=3072, num_experts=4):super().__init__()self.experts = nn.ModuleList([nn.Sequential(nn.Linear(hidden_dim, ffn_dim),nn.ReLU(),nn.Linear(ffn_dim, hidden_dim)) for _ in range(num_experts)])self.router = nn.Linear(hidden_dim, num_experts)  # 简单路由器打分def forward(self, x):batch_size, seq_len, hidden_dim = x.shapescores = self.router(x)                        # [B, S, num_experts]top1_idx = torch.argmax(scores, dim=-1)        # 每个 token 的 top1 indexoutput = torch.zeros_like(x)for i in range(len(self.experts)):mask = (top1_idx == i)                     # 选择当前 expert 的 tokenif mask.any():expert_out = self.experts[i](x[mask])output[mask] = expert_outreturn output# 4️⃣ MoE + Gate(Top-2 激活)
class MoEGatedFFN(nn.Module):def __init__(self, hidden_dim=768, ffn_dim=3072, num_experts=4):super().__init__()self.experts = nn.ModuleList([nn.Sequential(nn.Linear(hidden_dim, ffn_dim),nn.ReLU(),nn.Linear(ffn_dim, hidden_dim)) for _ in range(num_experts)])self.router = nn.Linear(hidden_dim, num_experts)def forward(self, x):batch_size, seq_len, hidden_dim = x.shapescores = self.router(x)                                     # [B, S, num_experts]top2 = torch.topk(scores, k=2, dim=-1)                      # top-2 分数与索引idx1, idx2 = top2.indices[..., 0], top2.indices[..., 1]w1, w2 = F.softmax(top2.values, dim=-1).unbind(-1)         # softmax 得到 gate 权重out = torch.zeros_like(x)for i in range(len(self.experts)):mask1 = (idx1 == i)mask2 = (idx2 == i)if mask1.any():out[mask1] += self.experts[i](x[mask1]) * w1[mask1].unsqueeze(-1)if mask2.any():out[mask2] += self.experts[i](x[mask2]) * w2[mask2].unsqueeze(-1)return out

GATE的再次介绍:
是的,完全正确 ✅!

🧠 简单一句话解释:

当 MoE 使用 Top-2 路由 时,模型会从所有 Experts 中为每个 token 选出 得分最高的两个专家,
然后用 Gate 权重 对这两个专家的输出进行加权融合。

🔧 举个例子更清楚:

假设一个 token 的 Router 输出如下:

Expert 打分(未归一化)
E1 0.2
E2 0.6
E3 0.9
E4 0.1

•	Top-2 = E3 和 E2
•	Gate 权重(Softmax 归一化):
•	E3:exp(0.9) / (exp(0.9)+exp(0.6)) ≈ 0.58
•	E2:exp(0.6) / (exp(0.9)+exp(0.6)) ≈ 0.42

最终输出:

output = E3(x) * 0.58 + E2(x) * 0.42

这就是 Gate!

✅ Gate 的作用

功能 描述
🎛️ 控制融合比例 避免只依赖一个 expert,提供更多表达能力
🧠 提高稳定性 减少“选错专家”带来的灾难性影响
📈 提升精度 多个 expert 融合可以覆盖更多语义空间

📌 所以总结:

Top-1 路由:只选一个专家 → 无需 gate,直接输出
Top-2 路由:选两个专家 → 必须 gate 加权融合

相关文章:

Qwen2.5技术报告阅读

论文概述 ⸻ 🧠 1. 模型概述 Qwen2.5 是阿里巴巴推出的一系列大语言模型(LLMs),在 预训练数据量 和 后训练方法 上都比前一代 Qwen2 有了显著提升。 ⸻ 📈 2. 模型特点 • 预训练数据量提升:从 7 万亿…...

HDCP(二)

HDCP加密算法实现详解 HDCP(高带宽数字内容保护)的加密算法实现涉及对称加密、密钥派生、动态同步机制等核心环节,其设计兼顾实时性与安全性。以下从算法类型、流程实现、硬件集成等角度展开分析: 1. 加密算法类型与版本差异 •…...

POSIX线程(pthread)库:线程的终止与管理

在POSIX线程(pthread)库中,线程的终止和管理涉及多个关键函数。以下是关于线程终止的pthread系列函数的详细介绍: 1. pthread_exit:线程主动退出 ✨ 功能: 允许线程主动终止自身,并返回一个退出…...

Elasticsearch 系列专题 - 第三篇:搜索与查询

搜索是 Elasticsearch 的核心功能之一。本篇将介绍如何构建高效的查询、优化搜索结果,以及调整相关性评分,帮助你充分发挥 Elasticsearch 的搜索能力。 1. 基础查询 1.1 Match Query 与 Term Query 的区别 Match Query:用于全文搜索,会对查询词进行分词。 GET /my_index/_…...

【AI提示词】Emoji风格排版艺术与设计哲学

提示说明 Emoji风格排版艺术与设计哲学。 提示词 请使用 Emoji 风格编辑以下段落,该风格以引人入胜的标题、每个段落中包含表情符号和在末尾添加相关标签为特点。请确保保持原文的意思。使用案例(春日穿搭) 🌸 2025春季穿搭灵…...

C语言 ——— 认识C语言

认识 main 函数 main 函数是程序的入口,程序执行时会从 main 函数的第一行开始执行,且一个工程中 main 函数有且只有一个 标准的 main 函数格式: int main() {return 0; } int 是类型,这里指的是 main 函数的返回类型 return…...

44、Spring Boot 详细讲义(一)

Spring Boot 详细讲义 目录 Spring Boot 简介Spring Boot 快速入门Spring Boot 核心功能Spring Boot 技术栈与集成Spring Boot 高级主题Spring Boot 项目实战Spring Boot 最佳实践总结 一、Spring Boot 简介 1. Spring Boot 概念和核心特点 1.1、什么是 Spring Boot&#…...

STM32硬件IIC+DMA驱动OLED显示——释放CPU资源,提升实时性

目录 前言 一、软件IIC与硬件IIC 1、软件IIC 2、硬件IIC 二、STM32CubeMX配置KEIL配置 三、OLED驱动示例 1、0.96寸OLED 2、OLED驱动程序 3、运用示例 4、效果展示 总结 前言 0.96寸OLED屏是一个很常见的显示模块,其驱动方式在用采IIC通讯时,常用软件IIC…...

Android 中绕过hwbinder 实现跨模块对audio 的HAL调用

需求 Audio 模块中专门为 TV 产品添加了一些代码,需要在 hdmi 的 HAL 代码中进行调用以完成某些功能。 解决方法 首先将 hdmi HAL 要调用的 audio 接口函数所在的 .so 链接到最基本的 lib.primay.amlogic.so 中(其它平台上这个 .so 文件的名字也可能是…...

基于单片机技术的手持式酒精检测电路设计

基于STC89C52单片机的酒精检测仪设计 目录 基于STC89C52单片机的酒精检测仪设计一、简介二、酒精测试仪总体方案设计2.1 酒精检测仪设计要求分析2.2 设计框图 三、硬件设计3.1 酒精检测电路3.2 模数转换电路3.3 STC89c52单片机电路3.4 LED显示电路3.5 声光报警电路3.6 按键和复…...

【车道线检测(0)】卷首语

车道线检测领域,早期的LaneNet、CondLaneNet等模型。现在在精度、实时性、复杂场景适应性等方面有了更多进展。 ​Head(输出头)的设计角度分类 在车道线检测任务中,Head(输出头)的设计角度直接影响模型的…...

记一次某网络安全比赛三阶段webserver应急响应解题过程

0X01 任务说明 0X02 靶机介绍 Webserver(Web服务器)是一种软件或硬件设备,用于接收、处理并响应来自客户端(如浏览器)的HTTP请求,提供网页、图片、视频等静态或动态内容,是互联网基础设施的核心…...

AI 越狱技术剖析:原理、影响与防范

一、AI 越狱技术概述 AI 越狱是指通过特定技术手段,绕过人工智能模型(尤其是大型语言模型)的安全防护机制,使其生成通常被禁止的内容。这种行为类似于传统计算机系统中的“越狱”,旨在突破模型的限制,以实…...

项目进度延误的十大原因及应对方案

项目进度延误主要源于以下十大原因:目标不明确、需求频繁变更、资源配置不足或不合理、沟通不畅、风险管理不足、缺乏有效的项目监控、技术难题未及时解决、团队协作效率低下、决策链过长、外部因素影响。其中,需求频繁变更是导致延误的关键因素之一&…...

瑞友客户端登录GS_ERP时,报错: 由于安全许可证服务器不能提供许可证,连接被中断的解决方法

瑞友客户端登录GS_ERP时,报错:由于安全许可证服务器不能提供许可证,连接被中断的解决方法 瑞友客户端登录GS_ERP时, 报错:由于安全许可证服务器不能提供许可证,连接被中断的解决方法是由于远程桌面连接协议…...

android wifi通过命令行打开2.4G热点

android系统支持2G和5G,但车机系统应用只支持5G,但是需要测试2.4G的射频 方法如下: 1、adb shell 进去,su 指定root权限,确保热点处于关闭状态 2、开启热点为www99999, 密码为12345678, wpa2的加密协议 cm…...

truncate,drop,delete分析

truncate,drop,delete对比分析 特性 TRUNCATE DROP DELETE **操作对象** 表中的所有数据 整个表及其所有数据 表中的特定数据 **是否保留表结构** 是 否 是 **是否可恢复** 不可恢复 不可恢复 可恢复 **性能** 高 高 低(逐行删除) …...

vue+flask图书知识图谱推荐系统

文章结尾部分有CSDN官方提供的学长 联系方式名片 文章结尾部分有CSDN官方提供的学长 联系方式名片 关注B站,有好处! 编号: F025 架构: vueflaskneo4jmysql 亮点:协同过滤推荐算法知识图谱可视化 支持爬取图书数据,数据超过万条&am…...

什么是微前端?有什么好处?有哪一些方案?

微前端(Micro Frontends) 微前端是一种架构理念,借鉴了微服务的思想,将一个大型的前端应用拆分为多个独立、自治的子应用,每个子应用可以由不同团队、使用不同技术栈独立开发和部署,最终聚合为一个整体产品…...

prompts提示词经典模板

prompts.py 中的提示词模板详解 文件中定义了两个核心提示词模板:REASON_PROMPT 和 RELEVANT_EXTRACTION_PROMPT。这两个模板在 DeepResearcher 的推理过程中扮演着关键角色。下面我将详细解析这两个模板的结构和功能。 REASON_PROMPT 详解 REASON_PROMPT 是用于指…...

pytorch软件封装

封装代码,通过传入文件名,即可输出类别信息 上一章节,我们做了关于动物图像的分类,接下来我们把程序封装,然后进行预测。 单张图片的predict文件 predict.py 按着路径,导入单张图片做预测from torchvis…...

DAY02:【pytorch】计算图与动态图机制

一、引言 在深度学习框架中,计算图是理解自动求导和模型优化的核心概念。无论是PyTorch的动态图机制,还是TensorFlow早期的静态图模式,计算图都扮演着关键角色。本文将深入解析计算图的基本原理,并结合PyTorch代码演示动态图的运…...

基于元学习(Meta-Learning)的恶意流量检测

元学习(Meta-Learning),即“学会学习”(Learning to Learn),通过让模型从多个相关任务中提取通用知识,实现对新任务的快速适应。在恶意流量检测领域,元学习的核心价值在于从少量攻击样本中泛化出检测规则,尤其适用于新型攻击、定向APT攻击等数据稀缺场景。 一、元学习…...

JavaScript:游戏开发的利器

在近年来的科技迅速发展中,JavaScript 已逐渐成为游戏开发领域中最受欢迎的编程语言之一。它的跨平台特性、广泛的社区支持、丰富的库和框架使得开发者能够快速、有效地创建各种类型的游戏。本文将深入探讨 JavaScript 在游戏开发中的优势。 一、跨平台支持 JavaSc…...

玩转Docker | 使用Docker搭建pinry图片展示系统

玩转Docker | 使用Docker搭建pinry图片展示系统 前言一、Pinry介绍Pinry 简介Pinry 特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署pinry服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问pinry应用五、pinry基本使用5.1 注册pinry账号…...

DAPP实战篇:使用web3.js实现前端输入钱包地址查询该地址的USDT余额——前端篇

专栏:区块链入门到放弃查看目录-CSDN博客文章浏览阅读385次。为了方便查看将本专栏的所有内容列出目录,按照顺序查看即可。后续也会在此规划一下后续内容,因此如果遇到不能点击的,代表还没有更新。声明:文中所出观点大多数源于笔者多年开发经验所总结,如果你想要知道区块…...

企业信息化-系统架构师(九十八)

1在对一个软件系统进行设计与确认后,需要进行架构复审,架构复审目的标识潜在风险,及早发现架构的缺陷和漏洞,在架构复审过程中,主要由()决定架构满足需求,质量需求是否在设计中体现。…...

【C++算法】54.链表_合并 K 个升序链表

文章目录 题目链接:题目描述:解法C 算法代码: 题目链接: 23. 合并 K 个升序链表 题目描述: 解法 解法一:暴力解法 每个链表的平均长度为n,有k个链表,时间复杂度O(nk^2) 合并两个有序…...

阿里云CDN应对DDoS攻击策略

阿里云CDN遭遇DDoS攻击时,可通过以下综合措施进行应对,保障服务的稳定性和可用性: 1. 启用阿里云DDoS防护服务 阿里云提供专业的DDoS防护服务,通过流量清洗中心过滤恶意流量,确保合法请求正常传输。该服务支持按需选…...

MySQL8的索引跳跃扫描原理

#MySQL 8 的索引跳跃扫描(Index Skip Scan)原理 1. 什么是索引跳跃扫描?索引跳跃扫描(Index Skip Scan)是 MySQL 8.0.13 引入的一种优化技术,允许在某些情况下跳过联合索引的最左前缀字段,仍然…...

centos 启动nginx 服务器

✅ 如果你是通过 yum 安装的 Nginx(推荐方式): 🔹 启动 Nginx: sudo systemctl start nginx 🔹 设置开机自启(建议开启): sudo systemctl enable nginx &#x1f53…...

格式化输出

% 符号相关 数据类型代码 %s:字符串 示例:print("名字是 %s" % "Tom") → 名字是 Tom%c:字符/ASCII码 示例:print("%c" % 65) → A%d/%i:有符号整数 示例:print("年龄…...

[leetcode]动态规划:斐波那契数列

一.线性dp 1.0什么是线性dp 线性DP就是指状态的转移具有线性递推关系&#xff0c;每个状态只依赖之前的状态&#xff0c;按照线性顺序一步步递推下去。 1.1斐波那契数列问题 #include <iostream> #include <vector> using namespace std; int main() { in…...

HackMyVM - todd记录

HackMyVM - toddhttps://mp.weixin.qq.com/s/E_-hepdfY-0veilL1fl2QA...

【spark认任务提交】配置优先级顺序

配置优先级顺序 Spark-submit 命令行参数 (最高优先级)代码中通过 SparkConf 设置的参数 (在应用程序中直接设置)spark-defaults.conf 文件中的配置 实际应用中的建议 固定配置&#xff1a;将集群级别的默认配置放在 spark-defaults.conf 中应用特定配置&#xff1a;将应用特…...

如何建立高效的会议机制

建立高效的会议机制需做到&#xff1a;明确会议目标、制定并提前分发议程、控制会议时长、确保有效沟通与反馈、及时跟进执行情况。其中&#xff0c;明确会议目标是核心关键&#xff0c;它直接决定了会议的方向与效率。只有明确目标&#xff0c;会议才不会偏离初衷&#xff0c;…...

spark Core-RDD转换算子

1. map算子&#xff1a;对RDD中的数据逐条进行映射转换&#xff0c;可实现类型或值的转换。函数签名为 def map[U: ClassTag](f: T > U): RDD[U] 。 2. mapPartitions算子&#xff1a;以分区为单位处理数据&#xff0c;可进行任意处理。与 map 相比&#xff0c; map 是分区内…...

【图像处理】C++实现通用Raw图转Unpack14的高效方法

一、需求背景 在图像处理领域&#xff0c;我们经常需要处理各种位深的原始数据&#xff08;如Raw8、Unpack10等&#xff09;。某些高端相机或传感器会输出14位精度的图像数据&#xff0c;但受传输限制&#xff0c;实际存储时可能采用低位深打包。本文将实现一个通用转换函数&a…...

Vue3的Composition API与React Hooks有什么异同?

Vue3的一个重大更新点就是支持Composition API&#xff0c;而且也被业界称为hooks&#xff0c;那么Vue3的“Hooks”与React的Hooks有这么区别呢&#xff1f; 一、核心相似点 1. 逻辑复用与代码组织 都解决了传统类组件或选项式 API 中逻辑分散的问题&#xff0c;允许将相关逻…...

Gerrit的安装与使用说明(Ubuntu)

#本页面按192.168.60.148服务器举例进行安装配置 1.权限配置 ## 使用root或者有sudo权限用户执行 # 创建gerrit用户 sudo useradd gerrit # 设置gerrit用户的密码 sudo passwd gerrit # 增加sudo权限 sudo visudo 在root ALL(ALL:ALL) ALL行下添加如下内容 gerrit ALL(ALL:…...

如何在Git历史中抹掉中文信息并翻译成英文

如何在Git历史中抹掉中文信息并翻译成英文 在软件开发和版本控制领域&#xff0c;维护一个清晰、一致的代码历史记录是至关重要的。然而&#xff0c;有时我们可能会遇到需要修改历史提交的情况&#xff0c;比如删除敏感信息或修正错误。本文将详细探讨如何在Git历史中抹掉中文…...

Ubuntu利用docker将ONNX模型转换为RK3588模型

1.安装docker 下载教程 1.拉取镜像 方法一&#xff1a;通过命令拉取 # 下载官方Docker镜像sudo docker pull registry.cn-hangzhou.aliyuncs.com/rockchip/rknn-toolkit2:v2.3.0 方法二&#xff1a;通过rknn-toolkit2自带的直接安装 2.开始工作 创建工作目录并复制ONNX模型…...

Go:入门

文章目录 Hello, World命令行参数找出重复行GIF动画获取一个URL并发获取多个URL一个 Web 服务器其他 Hello, World Hello world package main import "fmt" func main() {fmt.Println("Hello, 世界") }package main表明这是一个可独立执行的程序包&#…...

深入理解 ResponseBodyAdvice 及其应用

ResponseBodyAdvice 是 Spring MVC 提供的一个强大接口&#xff0c;允许你在响应体被写入 HTTP 响应之前对其进行全局处理。 下面我将全面介绍它的工作原理、使用场景和最佳实践。 基本概念 接口定义 public interface ResponseBodyAdvice<T> {boolean supports(Metho…...

SpringBoot对接火山引擎大模型api实现图片识别与分析

文章目录 一、前言二、创建应用三、后端1.SDK集成2.调用Rest API 四、前端 一、前言 Spring AI实战初体验——实现可切换模型AI聊天助手-CSDN博客 如上&#xff0c;在上一篇博客&#xff0c;我们已经实现了spring ai对接本地大模型实现了聊天机器人&#xff0c;但是目前有个新…...

Java ---成员,局部变量与就近原则

成员变量 声明在类内部&#xff0c;但在方法、构造器或代码块之外的变量。 属于类的实例&#xff08;对象&#xff09;或类本身&#xff08;静态变量&#xff09;。 实例变量&#xff08;非静态成员变量&#xff09;&#xff1a; public class Person {private String name…...

基于libevent写一个服务器(附带源码)

使用libevent搭建服务器 服务器源码二级目录 使用开源框架&#xff0c;目的是减少程序员对一些精细的操作的误操作&#xff0c;也是为了让程序员能更好的对接业务而不是底层api的使用。 为何使用libevent&#xff0c;因为libevent开源已经有十几年了&#xff0c;能很好的承受数…...

2.2.3 Spark Standalone集群

搭建Spark Standalone集群需要完成多个步骤。首先&#xff0c;配置主机名、IP地址映射、关闭防火墙和SeLinux&#xff0c;并设置免密登录。接着&#xff0c;配置JDK和Hadoop环境&#xff0c;并在所有节点上分发配置。然后&#xff0c;下载并安装Spark&#xff0c;配置环境变量和…...

每天记录一道Java面试题---day38

说说类加载器双亲委派模型 回答重点 AppClassLoader的父加载器是ExtClassLoader&#xff0c;ExtClassLoader的父加载器是BootStrapClassLoader。JVM在加载一个类时&#xff0c;会调用AppClassLoader的laodClass方法来加载这个类&#xff0c;不过在这个方法中&#xff0c;会先…...

[ctfshow web入门] web33

信息收集 相较于上一题&#xff0c;这题多了双引号的过滤。我猜测这一题的主要目的可能是为了不让使用$_GET[a]之类的语句&#xff0c;但是$_GET[a]也是一样的 没有括号可以使用include&#xff0c;没有引号可以使用$_GET 可以参考[ctfshow web入门] web32&#xff0c;其中的所…...