当前位置: 首页 > news >正文

NLP高频面试题(四十七)——探讨Transformer中的注意力机制:MHA、MQA与GQA

MHA、MQA和GQA基本概念与区别

1. 多头注意力(MHA)

多头注意力(Multi-Head Attention,MHA)通过多个独立的注意力头同时处理信息,每个头有各自的键(Key)、查询(Query)和值(Value)。这种机制允许模型并行关注不同的子空间上下文信息,捕捉复杂的交互关系。然而,MHA存在一个明显问题:计算和内存开销巨大,尤其在长序列任务中,键值缓存(KV-cache)显著增加,限制了模型在实际推理阶段的可扩展性。

2. 多查询注意力(MQA)

MQA(Multi-Query Attention)提出的解决方案是将所有查询头共享同一组键值对,极大地减少KV缓存大小。这种共享机制提高了推理时的效率和速度,但因缺少独立键值,可能在精细化任务或复杂场景下出现性能下降。

3. 分组查询注意力(GQA)

GQA(Grouped Query Attention)则折中于MHA与MQA之间,提出将查询头分为若干组,每组共享一套键

相关文章:

NLP高频面试题(四十七)——探讨Transformer中的注意力机制:MHA、MQA与GQA

MHA、MQA和GQA基本概念与区别 1. 多头注意力(MHA) 多头注意力(Multi-Head Attention,MHA)通过多个独立的注意力头同时处理信息,每个头有各自的键(Key)、查询(Query)和值(Value)。这种机制允许模型并行关注不同的子空间上下文信息,捕捉复杂的交互关系。然而,MHA…...

k230学习笔记-疑难点(1)

1.出现boot failed with exit code 19: 需要将k230开发板的btoot0拨到ON 2.出现boot failed with exit code 13: 说明k230开发板的固件烧录已经丢失,需要重新烧录 *** 注意重新烧录时需要将btoot0重新拨到OFF,才会弹出加载固件需要的通用串行总线&…...

JavaScript性能优化实战:让你的Web应用飞起来

JavaScript性能优化实战:让你的Web应用飞起来 在前端开发中,JavaScript性能优化是提升用户体验的关键。一个性能良好的应用不仅能吸引用户,还能提高转化率和用户留存率。今天,我们就来深入探讨JavaScript性能优化的实战技巧&…...

金融数据库转型实战读后感

荣幸收到老友太保科技有限公司数智研究院首席专家林春的签名赠书。 这是国内第一本关于OceanBase数据库实际替换过程总结的的实战书。打个比方可以说是从战场上下来分享战斗经验。读后感受颇深。我在这里讲讲我的感受。 第三章中提到的应用改造如何降本。应用改造是国产化替换…...

血脂代谢通路(医学-计算机系统对照方式)

血脂代谢通路(医学-计算机系统对照方式) 整合所有类比,用医学-计算机系统对照的方式完整描述血脂代谢通路,采用分步骤的对照结构: 1. 食物摄入(数据输入层) # 医学术语: 膳食脂肪摄入 → 计算机类比: 原始数据输入 …...

git更新的bug

文章目录 1. 问题2. 分析 1. 问题 拉取了一个项目后遇到了这个问题, nvocation failed Server returned invalid Response. java.lang.RuntimeException: Invocation failed Server returned invalid Response. at git4idea.GitAppUtil.sendXmlRequest(GitAppUtil…...

直流电源基本原理

整流电路 在构建整流电路时,要选择合适参数的二极管 If是二极管能够通过电流的能力,也是最大整流的平均电流。 还要考虑二极管的反向截至电压。 脉动系数电压交流幅值/直流平均电压(越小越好) 三相整流电路优点: …...

Git -> git merge --no-ff 和 git merge的区别

git merge --no-ff <branch> 与 git merge <branch> 的区别 核心区别 git merge <branch>: 默认使用Fast-forward模式&#xff08;若可行&#xff09;不创建额外的合并提交记录合并后看不出曾经存在过分支 git merge --no-ff <branch>:强制创建一个…...

名胜古迹传承与保护系统(springboot+ssm+vue+mysql)含运行文档

名胜古迹传承与保护系统(springbootssmvuemysql)含运行文档 名胜古迹传承与保护系统是一个专注于文化遗产保护和管理的综合性平台。系统提供了一系列功能模块&#xff0c;包括名胜古迹管理、古迹预约管理、古迹故事管理、举报信息管理、保护措施管理、古迹讨论、管理员管理、版…...

windows资源管理器左边导航窗格增加2个项,windows10/11有效

下面文档存为.reg文件&#xff0c; Windows Registry Editor Version 5.00; 根 CLSID —— 名称、图标、固定到导航窗格 [HKEY_CURRENT_USER\Software\Classes\CLSID\{C1A3F2D2-BD2D-4D60-82C5-394F01753A5F}] "手机系统" "System.IsPinnedToNamespaceTree&quo…...

【八股文】基于源码聊聊ConcurrentHashmap的设计

版本演进 jdk 1.7中是分段锁的设计&#xff0c;将哈希表划分为多个segment&#xff0c;每个段独立加锁&#xff0c;锁粒度为段级别。 操作需两次哈希&#xff0c;第一次定位段&#xff0c;第二次定位桶内链表。这种实现方式的缺点就是段数量固定&#xff0c;扩容复杂&#xf…...

Mysql--基础知识点--93--两阶段提交

1 两阶段提交 以update语句的具体执行过程为例&#xff1a; 具体更新一条记录 UPDATE t_user SET name ‘xiaolin’ WHERE id 1;的流程如下&#xff1a; 1.执行器负责具体执行&#xff0c;会调用存储引擎的接口&#xff0c;通过主键索引树搜索获取 id 1 这一行记录&#…...

数字化招标采购系统怎么让招采协同更高效?

招标采购领域的数智化转型正在引发行业革命性变革。从传统线下模式到全流程电子化&#xff0c;再到当前数智化阶段的超时空协同&#xff0c;行业的演进路径清晰展现了技术与管理的深度融合。郑州信源信息数智化招采系统作为行业标杆&#xff0c;其创新实践为未来协同工作方式的…...

池塘计数(BFS)

题目描述 由于最近的降雨&#xff0c;光头强的田地里的各个地方都积水了&#xff0c;用 NM(1≤N≤100&#xff1b;1≤M≤100)NM(1≤N≤100&#xff1b;1≤M≤100) 的正方形的矩形表示。每个广场都有水 W 或旱地 .。光头强想知道他的田地里形成了多少池塘。池塘是指一组相邻的有…...

《Science》观点解读:AI无法创造真正的智能体(AI Agent)

无论是想要学习人工智能当做主业营收&#xff0c;还是像我一样作为开发工程师但依然要运用这个颠覆开发的时代宠儿&#xff0c;都有必要了解、学习一下人工智能。 近期发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;入行门槛低&#x…...

从零开始学A2A四:A2A 协议的安全性与多模态支持

文章目录 A2A 协议的安全性与多模态支持一、A2A 协议安全机制1. 认证机制2. 授权机制3. 数据加密 二、多模态交互支持1. 文本交互2. 音频支持3. 视频与图像处理4. 复合数据格式 三、安全与多模态最佳实践1. 安全性实践2. 多模态实践 四、与 MCP 的对比1. 安全机制对比2. 多模态…...

一种大位宽加减法器的时序优化

平台&#xff1a;vivado2018.3 芯片&#xff1a;xc7a100tfgg484-2 (active) 在FPGA中实现超高位宽加减法器&#xff08;如256&#xff09;时&#xff0c;时序收敛常成为瓶颈。由于进位链&#xff08;Carry Chain&#xff09;跨越多级逻辑单元&#xff0c;关键路径延迟会随位宽…...

【专业解读:Semantic Kernel(SK)】大语言模型与传统编程的桥梁

目录 Start:什么是Semantic Kernel&#xff1f; 一、Semantic Kernel的本质&#xff1a;AI时代的操作系统内核 1.1 重新定义LLM的应用边界 1.2 技术定位对比 二、SK框架的六大核心组件与技术实现 2.1 内核&#xff08;Kernel&#xff09;&#xff1a;智能任务调度中心 2…...

InfiniBand与RoCEv2负载均衡机制的技术梳理与优化实践

AI技术的高速迭代正驱动全球算力格局进入全新纪元。据IDC预测&#xff0c;未来五年中国智能算力规模将以超50%的年复合增长率爆发式扩张&#xff0c;数据中心全面迈入“智能算力时代”。然而&#xff0c;海量AI训练、实时推理等高并发场景对底层网络提出了更严苛的挑战——超大…...

Vue与React组件化设计对比

组件化是现代前端开发的核心思想之一&#xff0c;而Vue和React作为两大主流框架&#xff0c;在组件化设计上既有相似之处&#xff0c;也存在显著差异。本文将从语法设计、数据管理、组件通信、性能优化、生态系统等多个方向&#xff0c;结合实例详细对比两者的特点。 一、模板…...

UE中通过AAIController::MoveTo函数巡逻至目标点后没法正常更新巡逻目标点

敌人巡逻的逻辑如下&#xff1a; 敌人在游戏一开始的时候就通过moveto函数先前往首先设定的patroltarget目标&#xff0c;在距离patroltarget距离为patroradius&#xff08;200unit)之内时就可以通过checkpatroltarget函数更新新的patroltarget目标&#xff0c;随后前往新的pat…...

Python-细节知识点range函数的详解

在 Python 中&#xff0c;range 是一个内置函数&#xff0c;用于生成一个不可变的整数序列&#xff0c;通常用于控制循环次数或生成数值范围。以下是详细说明&#xff1a; 基本语法 range(stop) # 生成 [0, stop) 的整数&#xff0c;步长为1 range(start, stop) …...

git rebase的使用

我的使用 git checkout feature # 本地分支 git pull origin main --rebase # 目标分支 git pull origin feature --rebase git push origin featuregit rebase 是 Git 中用于重写提交历史的强大工具&#xff0c;可将分支的提交移动到新的基点上&#xff0c;使历史更线性。以…...

CMake Error at build/_deps/glog-src/CMakeLists.txt:1 (cmake_minimum_required):

这个错误提示意思是你当前系统上安装的 CMake 版本过低&#xff0c;不满足项目的要求。根据错误信息&#xff1a; CMake Error at build/_deps/glog-src/CMakeLists.txt:1 (cmake_minimum_required): CMake 3.22 or higher is required. You are running version 3.16.3 项目…...

MATLAB 控制系统设计与仿真 - 34

多变量系统知识回顾 - MIMO system 这一章对深入理解多变量系统以及鲁棒分析至关重要 首先&#xff0c;对于如下系统&#xff1a; 当G(s)为单输入&#xff0c;单输出系统时&#xff1a; 如果&#xff1a; 则&#xff1a; 所以 当G(s)为MIMO时&#xff0c;例如2X2时&#xff…...

【Unity】JSON数据的存取

这段代码的结构是为了实现 数据的封装和管理&#xff0c;特别是在 Unity 中保存和加载玩家数据时。以下是对代码设计的逐步解释&#xff1a; 1. PlayerCoin 类 PlayerCoin 是一个简单的数据类&#xff0c;用于表示单个玩家的硬币信息。它包含以下字段&#xff1a; count&…...

利用 Java 爬虫按关键字搜索淘宝商品

在电商领域&#xff0c;通过关键字搜索商品是常见的需求。淘宝作为国内知名的电商平台&#xff0c;提供了丰富的商品搜索功能。本文将详细介绍如何使用 Java 爬虫技术按关键字搜索淘宝商品&#xff0c;并获取搜索结果的详细信息。 一、准备工作 1. 注册淘宝开放平台账号 要使…...

【C】初阶数据结构11 -- 选择排序

本篇文章主要讲解经典排序算法 -- 选择排序 目录 1 算法思想 2 代码 3 时间复杂度与空间复杂度分析 1&#xff09; 时间复杂度 2&#xff09; 空间复杂度 1 算法思想 选择排序是一种在一段区间里面选择最小的元素和最大的元素的一种排序算法。假设这里排升序&#…...

【Semantic Kernel核心组件】Plugin:连接AI与业务逻辑的桥梁

目录 一、Plugin是什么&#xff1f;为什么它是SK的核心&#xff1f; 一、Plugin的核心机制与Python实现 1. 插件类型&#xff1a;语义函数与本地函数 语义函数&#xff08;Semantic Function&#xff09; 本地函数&#xff08;Native Function&#xff09; 2. Plugin的注…...

《基于神经网络实现手写数字分类》

《基于神经网络实现手写数字分类》 一、主要内容&#xff1a; 1、通过B站陈云霁老师的网课&#xff0c;配合书本资料&#xff0c;了解神经网络的基本组成和数学原理。 2、申请云平台搭建实验环境 3、基于5个不同的实验模块逐步理解实验操作步骤&#xff0c;并实现不同模块代码…...

车载诊断架构 --- 车载诊断概念的深度解读

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 周末洗了一个澡,换了一身衣服,出了门却不知道去哪儿,不知道去找谁,漫无目的走着,大概这就是成年人最深的孤独吧! 旧人不知我近况,新人不知我过…...

四、探索LangChain:连接语言模型与外部世界的桥梁

一、什么是 LangChain LangChain 是一个开源的软件框架,旨在帮助开发者高效构建和部署基于**大型语言模型(LLM)**的应用程序。它通过提供一系列工具、组件和接口,简化了从模型调用、提示工程到复杂应用开发的全流程,使得开发者能够快速将 LLM 集成到实际场景中。 1. 核心…...

LangChain4j中的Chat与语言模型API详解:构建高效对话系统的利器

LangChain4j中的Chat与语言模型API详解&#xff1a;构建高效对话系统的利器 引言&#xff1a;大模型时代的开发利器 在人工智能快速发展的今天&#xff0c;大型语言模型&#xff08;LLM&#xff09;已成为构建智能应用的核心组件。LangChain4j作为Java生态中领先的LLM集成框架…...

C++中const与constexpr的区别

在C中&#xff0c;const和constexpr都用于定义常量&#xff0c;但它们的用途和行为有显著区别&#xff1a; ### 1. **初始化时机** - **const**&#xff1a;表示变量是只读的&#xff0c;但其值可以在**编译时或运行时**初始化。 cpp const int a 5; // 编译…...

长亭2月公开赛Web-ssrfme

环境部署 拉取环境报错&#xff1a; 可以尝试拉取一下ubuntu:16.04&#xff0c;看是否能拉取成功 将wersion&#xff1a;"3"删掉 我拉去成功之后&#xff0c;再去拉取环境&#xff0c;成功&#xff01; 访问环境 测试ssrf 源码 <?php highlight_file(__file__…...

AI日报 - 2025年4月18日

&#x1f31f; 今日概览(60秒速览) ▎&#x1f916; AGI探讨 | 专家激辩AGI定义与实现时间点&#xff0c;Causal AI被视为关键一步&#xff0c;o3模型预测2027年实现引关注。 Causal AI强调因果关系而非模式&#xff1b;专家清单推荐不同模型适用场景&#xff1b;AGI定义及何时…...

Spring IoC 详解

在 Spring IoC& DI 详解 中对 IoC已经有了介绍&#xff0c;下面对 IoC 进行详细介绍。 IoC&#xff0c;即控制反转&#xff0c;在之前我们编写程序的时候&#xff0c;我们都是自己 new 出来一个对象&#xff0c;然后自己去管理这个对象&#xff0c;但是这有时候有些麻烦&a…...

oracle查询当前用户所有字段和表

在 Oracle 数据库中&#xff0c;可以通过查询数据字典视图来获取某个表的字段&#xff08;列&#xff09;信息。以下是常用的查询方法&#xff1a; 查询当前用户下的表字段 如果您想查看当前用户下某个表的字段信息&#xff0c;可以查询 USER_TAB_COLUMNS 视图&#xff1a; SE…...

ACL(访问控制列表)

ACL(访问控制列表&#xff09; 1、基础内容 访问控制列表ACL(Access ControlList)是由一条或多条规则组成的集合。所谓规则&#xff0c;是指描述报文匹配条件的判断语句&#xff0c;这些条件可以是报文的源地址、目的地址、端口号等。通过一系列规则来匹配报文&#xff0c;如…...

C语言数据结构---二叉树---堆的应用

1.建堆&#xff08;向上调整&#xff09; 1.1大堆 #include<stdio.h> void swap(int *p1,int *p2) {int temp *p1;*p1 *p2;*p2 temp; } void Ajustup(int *a,int child)//向上调整 {int parent (child - 1) / 2;while (child > 0){if (a[child] > a[parent]…...

在Linux下安装Gitlab

在Cenos7下安装GitLab 在ssh下安装 官方安装文档:https://gitlab.cn/install/?versionce 1. 使用阿里YUM 镜像云 下载 https://mirrors.aliyun.com/repo/Centos-7.repo替换 /etc/yum.repos.d/CentOS-Base.repo在目录/etc/yum.repos.d/下执行如下命令&#xff1a; curl …...

【算法】快速排序、归并排序(非递归版)

目录 一、快速排序&#xff08;非递归&#xff09; 1.原理 2.实现 2.1 stack 2.2 partition(array,left,right) 2.3 pivot - 1 > left 二、归并排序&#xff08;非递归&#xff09; 1.原理 2.实现 2.1 gap 2.1.1 i 2*gap 2.1.2 gap * 2 2.1.3 gap < array.…...

如何自学机器学习?零基础到实战的完整路径

机器学习作为人工智能的核心领域&#xff0c;已成为技术人必备的硬实力。本文为自学者梳理出一条从零基础到项目落地的系统学习路线&#xff0c;涵盖知识框架、工具链与实战技巧。 一、构建三大基础模块&#xff08;1-2个月&#xff09; 数学基石&#xff1a;线性代数重点掌握…...

PHP开发环境搭建(Hbuider+phpstudy)

目录 1.Hbuider下载 Hbuider的网址 2.Hbuilder的安装 1-首先找到刚刚下载的安装包 2-然后进行解压 3-进入解压后的文件夹HBuilderX&#xff0c;找到HBuilderX这一项&#xff0c;双击打开 4-选择你喜欢的风格,任意选择一个就可以了 5-选择你选快捷键的方案 6-点击开始体验就可了…...

【4.1.-4.20学习周报】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 摘要Abstract一、方法介绍1.1HippoRAG 1.2HippoRAG2二、实验2.1实验概况2.2实验代码2.3实验结果 总结 摘要 本博客介绍了论文《From RAG to Memory: Non-Parametri…...

vim笔记

vim三种模式切换 命令常用 复制粘贴...

【JAVA】基础知识“抽象类”详解,从入门到理解~

目录 1. 抽象类 1.1 什么是抽象类❓ 1.2 为什么需要抽象类❓ 1.3 抽象类语法 1.4 抽象类特征 ① 抽象类是被abstract修饰的 ② 被abstract修饰的方法称为抽象方法&#xff0c;这个方法可以没有具体的实现 ③ 当一个类中含有抽象方法的时候&#xff0c;该类必须使用abst…...

docker 启动mysql9认证失败

docker compose 启动mysql9认证失败 随着mysql更新到了9版本&#xff0c;在docker中相较于8减少了一些体积&#xff0c;很吸引人尝试&#xff0c; 但是在使用原本的配置文件拉起mysql&#xff0c;连接时却提示权限认证失败 1045 - Access denied for user root172.18.0.1 (…...

【Axure绘制原型】图片切割、交互动效、热区、动态面板、元件显示隐藏、表单元件、表格、内联框架

切割 功能&#xff1a;将图片切成多部分。 通过移动鼠标可以调整两条虚线的位置&#xff0c;点击。虚线相当于切割刀&#xff0c;被虚线分离的部分将变成单独的图 切割后的图片&#xff1a; 交互 交互动效的构成&#xff1a; 目标&#xff1a;谁触发交互&#xff08;元…...

DeepSeek智能时空数据分析(一):筛选特定空间范围内的POI数据

时空数据分析很有用&#xff0c;但是GIS/时空数据库技术门槛太高 时空数据分析在优化业务运营中至关重要&#xff0c;尤其在数据驱动决策的当下&#xff0c;其价值正随大模型时代的到来进一步凸显。然而&#xff0c;三大挑战仍制约其发展&#xff1a;技术门槛高&#xff0c;需…...