当前位置: 首页 > news >正文

rust-candle学习笔记11-实现一个简单的自注意力

参考:about-pytorch

定义ScaledDotProductAttention结构体:

use candle_core::{Result, Device, Tensor};
use candle_nn::{Linear, Module, linear_no_bias, VarMap, VarBuilder, ops};struct ScaledDotProductAttention {wq: Linear,wk: Linear,wv: Linear,d_model: Tensor,device: Device,
}

为ScaledDotProductAttention结构体实现new方法:

impl ScaledDotProductAttention {fn new(vb: VarBuilder, embedding_dim: usize, out_dim: usize, device: Device) -> Result<Self> {Ok(Self { wq: linear_no_bias(embedding_dim, out_dim, vb.pp("wq"))?, wk: linear_no_bias(embedding_dim, out_dim, vb.pp("wk"))?, wv: linear_no_bias(embedding_dim, out_dim, vb.pp("wv"))?,d_model: Tensor::new(embedding_dim as f32, &device)?,device,})}
}

为结构体实现Module的forward trait:

impl Module for ScaledDotProductAttention {fn forward(&self, xs: &Tensor) -> Result<Tensor> {let q = self.wq.forward(xs)?;let k = self.wk.forward(xs)?;let v = self.wv.forward(xs)?;let attn_score = q.matmul(&k.t()?)?;let attn_score = attn_score.broadcast_div(&self.d_model.sqrt()?)?;let dim = attn_score.rank() - 1;let attn_weights = ops::softmax(&attn_score, dim)?;let attn_output = attn_weights.matmul(&v)?;Ok(attn_output)}
}

融合qkv实现:

定义ScaledDotProductAttentionFusedQKV结构体:

struct ScaledDotProductAttentionFusedQKV {w_qkv: Linear,d_model: Tensor,device: Device,
}

为结构体实现new方法:

impl ScaledDotProductAttentionFusedQKV {fn new(vb: VarBuilder, embedding_dim: usize, out_dim: usize, device: Device) -> Result<Self> {Ok(Self { w_qkv: linear_no_bias(embedding_dim, 3*out_dim, vb.pp("w_qkv"))?,d_model: Tensor::new(embedding_dim as f32, &device)?,device,})}
}

为结构体实现forward trait:

impl Module for ScaledDotProductAttentionFusedQKV {fn forward(&self, xs: &Tensor) -> Result<Tensor> {let qkv = self.w_qkv.forward(xs)?;let (batch_size, seq_len, _) = qkv.dims3()?;let qkv = qkv.reshape((batch_size, seq_len, 3, ()))?;let q = qkv.get_on_dim(2, 0)?;let q = q.reshape((batch_size, seq_len, ()))?;let k = qkv.get_on_dim(2, 1)?;let k = k.reshape((batch_size, seq_len, ()))?;let v = qkv.get_on_dim(2, 2)?;let v = v.reshape((batch_size, seq_len, ()))?;let attn_score = q.matmul(&k.t()?)?;let attn_score = attn_score.broadcast_div(&self.d_model.sqrt()?)?;let dim = attn_score.rank() - 1;let attn_weights = ops::softmax(&attn_score, dim)?;let attn_output = attn_weights.matmul(&v)?;Ok(attn_output)}
}

测试:

fn main() -> Result<()> {let device = Device::cuda_if_available(0)?;let varmap = VarMap::new();let vb = VarBuilder::from_varmap(&varmap, candle_core::DType::F32, &device);let input = Tensor::from_vec(vec![0.43f32, 0.15, 0.89, 0.55, 0.87, 0.66,0.57, 0.85, 0.64,0.22, 0.58, 0.33,0.77, 0.25, 0.10,0.05, 0.80, 0.55, 0.43, 0.15, 0.89, 0.55, 0.87, 0.66,0.57, 0.85, 0.64,0.22, 0.58, 0.33,0.77, 0.25, 0.10,0.05, 0.80, 0.55], (2, 6, 3), &device)?;// let model = ScaledDotProductAttention::new(vb.clone(), 3, 2, device.clone())?;let model = ScaledDotProductAttentionFusedQKV::new(vb.clone(), 3, 2, device.clone())?;let output = model.forward(&input)?;println!("output: {:?}\n", output);println!("output: {:?}\n", output.to_vec3::<f32>()?);Ok(())
}

相关文章:

rust-candle学习笔记11-实现一个简单的自注意力

参考&#xff1a;about-pytorch 定义ScaledDotProductAttention结构体&#xff1a; use candle_core::{Result, Device, Tensor}; use candle_nn::{Linear, Module, linear_no_bias, VarMap, VarBuilder, ops};struct ScaledDotProductAttention {wq: Linear,wk: Linear,wv: …...

RabbitMQ-运维

文章目录 前言运维-集群介绍多机多节点单机多节点 多机多节点下载配置hosts⽂件配置Erlang Cookie启动节点构建集群查看集群状态 单机多节点安装启动两个节点再启动两个节点验证RabbitMQ启动成功搭建集群把rabbit2, rabbit3添加到集群 宕机演示仲裁队列介绍raft算法协议 raft基…...

101 alpha——8 学习

alpha (-1 * rank(((sum(open, 5) * sum(returns, 5)) - delay((sum(open, 5) * sum(returns, 5)),这里我们操作符都明白&#xff0c;现在来看金融意义 金融意义 里层是这个 (sum(open, 5) * sum(returns, 5)) - delay((sum(open, 5) * sum(returns, 5)), 10 这里是两个相减…...

YOLOv1模型架构、损失值、NMS极大值抑制

文章目录 前言一、YOLO系列v11、核心思想2、流程解析 二、损失函数1、位置误差2、置信度误差3、类别概率损失 三、NMS&#xff08;非极大值抑制&#xff09;总结YOLOv1的优缺点 前言 YOLOv1&#xff08;You Only Look Once: Unified, Real-Time Object Detection&#xff09;由…...

webpack代理天地图瓦片

1.安装 npm install http-proxy-middleware --save-dev2.webpack代理 const { createProxyMiddleware } require(http-proxy-middleware);module.exports {devServer: {port: 8080, // 改为你需要的端口https: false, // 如果你启用了 https&#xff0c;这里要对应before(a…...

RabbitMQ-高级特性1

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言消息确认机制介绍手动确认方法代码前言代码编写消息确认机制的演示自动确认automanual 持久化介绍交换机持久化队列持久化消息持久化 持久化代码持久化代码演示…...

Git_idea界面进行分支合并到主分支详细操作

最近闲着也是闲着&#xff0c;再来讲一下Git合并分支的操作吧。基本上咱们干开发的都会用到git吧&#xff0c;比如我们在大数据开发中&#xff0c;有一个主分支master,还有其他的诸多分支dev1.1.0,dev1.2.0......等。 以我近期开发的代码来讲&#xff0c;在开发分支开发完毕后&…...

MOS关断时波形下降沿振荡怎么解决

问题阐述&#xff1a; 一个直流电机控制电路&#xff0c;部分原理图如下&#xff1a; 波形如下&#xff1a; 原因分析&#xff1a; L&#xff1a;线路寄生电感&#xff08;如PCB走线、MOS管引脚电感&#xff09;。 C&#xff1a;MOS管输出电容&#xff08;Coss&#xff09;、…...

【Day 23】HarmonyOS开发实战:从AR应用到元宇宙交互

一、空间感知开发实战 1. 环境语义建模&#xff08;NEXT增强&#xff09; // 构建3D空间语义地图 spatialMapper.createMap({mode: SEMANTIC, // 语义分割模式objectTypes: [WALL, FLOOR, TABLE, DOOR ],onUpdate: (mesh) > {this.arScene.updateMesh(mesh) // 实时更新3D…...

ZYNQ笔记(十九):VDMA VGA 输出分辨率可调

版本&#xff1a;Vivado2020.2&#xff08;Vitis&#xff09; 任务&#xff1a;以 VDAM IP 为核心实现 VGA 彩条图像显示&#xff0c;同时支持输出分辨率可调。 &#xff08;PS 端写入彩条数据到 DDR 通过 VDMA 读取出来输出给 VGA 进行显示&#xff09; 目录 一、介绍 二、硬…...

江西同为科技有限公司受邀参展2025长江流域跨博会

江西同为科技有限公司是一家专注于电力保护设备研发与生产的高新技术企业&#xff0c;深耕于电气联接与保护领域&#xff0c;同时产品远销海外&#xff0c;在国内国际市场与客户保持长期稳定的合作。江西同为在跨境电子商务领域运营多年&#xff0c;有着深厚、丰富的行业经验&a…...

2025 SD省集总结

文章目录 DAY1时间安排题解T1. 花卉港湾T2. 礎石花冠T3.磷磷开花 DAY2时间安排题解T1. MEX 求和T2.最大异或和T3.前缀最值 DAY3时间安排题解T1.重建: 地下铁道T2.走过安眠地的花丛T3.昔在、今在、永在的题目 DAY4时间安排题解T1.崩坏世界的歌姬T2.色彩褪去之后T3.每个人的结局 …...

代码随想论图论part06冗余连接

图论part06 冗余连接 代码随想录 冗余边就是已经边已经在并查集里了&#xff0c;从图的角度来说构成了环&#xff08;冗余连接2要用到这个概念&#xff09; 代码其他部分为&#xff1a;并查集初始化&#xff0c;查根&#xff0c;判断是否在集合里&#xff0c;加入集合 冗余…...

SCADA|KIO程序导出变量错误处理办法

哈喽,你好啊,我是雷工! 最近在用KingSCADA3.52版本的软件做程序时,在导出变量进行批量操作时遇到问题,现将解决办法记录如下。 以下为解决过程。 01 问题描述 在导出KIO变量时,选择*.xls格式和*.xlsx时均会报错: 报如下错误: Unknown error 0x800A0E7A ADODB Connectio…...

AUTOSAR图解==>AUTOSAR_SWS_V2XBasicTransport

AUTOSAR V2X 基础传输协议 (V2XBasicTransport) 详解 AUTOSAR经典平台中V2X通信基础传输层的规范解析 目录 1. 引言与功能概述 1.1 架构概述1.2 功能概述 2. V2XBtp模块架构 2.1 AUTOSAR架构中的V2XBtp位置2.2 主要组件与职责 3. V2XBtp模块接口 3.1 接口结构3.2 数据类型和依…...

从代码学习深度学习 - 区域卷积神经网络(R-CNN)系列 PyTorch版

文章目录 前言R-CNNFast R-CNN兴趣区域汇聚层 (RoI Pooling)代码示例:兴趣区域汇聚层 (RoI Pooling) 的计算方法Faster R-CNNMask R-CNN双线性插值 (Bilinear Interpolation) 与兴趣区域对齐 (RoI Align)兴趣区域对齐层的输入输出全卷积网络 (FCN) 的作用掩码输出形状总结前言…...

RT-THREAD RTC组件中Alarm功能驱动完善

使用Rt-Thread的目的为了更快的搭载工程&#xff0c;使用Rt-Thread丰富的组件和第三方包资源&#xff0c;解耦硬件&#xff0c;在更换芯片时可以移植应用层代码。你是要RTT的目的什么呢&#xff1f; 文章项目背景 以STM32L475RCT6为例 RTC使用的为LSE外部低速32 .756k Hz 的…...

VSCode如何解决打开html页面中文乱码的问题

VSCode如何解决打开html页面中文乱码的问题 &#xff08;1&#xff09;打开扩展商店&#xff1a; &#xff08;2&#xff09;点击左侧菜单栏的扩展图标&#xff08;或使用快捷键CtrlShiftX&#xff09;。 &#xff08;3&#xff09;搜索并安装插件&#xff1a; …...

Java学习手册:单体架构到微服务演进

一、单体架构概述 单体架构是一种传统的软件架构风格&#xff0c;所有的功能模块都构建在一个统一的部署单元中。这种架构的优点是简单直接&#xff0c;便于开发、测试和部署。然而&#xff0c;随着应用规模的增长和需求的复杂化&#xff0c;单体架构的弊端逐渐显现&#xff0…...

android动态调试

在 Android 应用逆向工程中&#xff0c;动态调试 Smali 代码是分析应用运行时行为的重要手段。以下是详细的步骤和注意事项&#xff1a; 1. 准备工作 工具准备&#xff1a; Apktool&#xff1a;反编译 APK 生成 Smali 代码。Android Studio/IntelliJ IDEA&#xff1a;安装 smal…...

Google的A2A和MCP什么关系

作者&#xff1a;蛙哥 原文&#xff1a;https://zhuanlan.zhihu.com/p/1893738350252385035 Agent2Agent和MCP在功能上各有侧重&#xff0c;A2A专注于Agent之间的协作&#xff0c;MCP关注于Agent与外部数据源的集成。因此&#xff0c;MCP并不完全覆盖 A2A 的能力场景&#xff0…...

计算几何图形算法经典问题整理

几何算法经典问题 文章目录 几何算法经典问题一、几何基础问题1. 判断两条线段是否相交2. 判断点是否在多边形内3. 凸包计算4. 判断一个有序点集的方向&#xff08;顺时针 or 逆时针&#xff09;5. 求多边形面积和重心 二、 高阶图形问题6. 最小外接矩形&#xff08;Minimum Bo…...

系分论文《论多云架构治理的分析和应用》

系统分析师论文范文系列 【摘要】 2022年3月&#xff0c;我所在公司承接了某金融机构“混合云资源管理与优化平台”的设计与实施项目。我作为系统分析师&#xff0c;主导了多云架构的规划与治理工作。该项目旨在构建一个兼容多家公有云及私有云资源的统一管理平台&#xff0c;解…...

(三)毛子整洁架构(Infrastructure层/DapperHelper/乐观锁)

文章目录 项目地址一、Infrastructure Layer1.1 创建Application层需要的服务1. Clock服务2. Email 服务3. 注册服务 1.2 数据库服务1. 表配置Configurations2. Respository实现3. 数据库链接Factory实现4. Dapper的DataOnly服务实现5. 所有数据库服务注册 1.3 基于RowVersion的…...

Femap许可使用数据分析

在当今竞争激烈的市场环境中&#xff0c;企业对资源使用效率和成本控制的关注日益增加。Femap作为一款业界领先的有限元分析软件&#xff0c;其许可使用数据分析功能为企业提供了深入洞察和智能决策的支持。本文将详细介绍Femap许可使用数据分析工具的特点、优势以及如何应用这…...

进入虚拟机单用户模式(Linux系统故障排查)

故障概述 虚拟机备份或者克隆后&#xff0c;无法通过编辑虚拟机IP&#xff0c;且忘记虚拟机密码&#xff0c;无法通过登录控制台修改虚拟机网络配置&#xff1a; 解决步骤 重启虚拟机并进入单用户模式修改网络配配置、设置密码等、大致两个步骤&#xff1a; 1、重启虚拟机 2、进…...

Python 数据分析与可视化:开启数据洞察之旅(5/10)

一、Python 数据分析与可视化简介 在当今数字化时代&#xff0c;数据就像一座蕴藏无限价值的宝藏&#xff0c;等待着我们去挖掘和探索。而 Python&#xff0c;作为数据科学领域的明星语言&#xff0c;凭借其丰富的库和强大的功能&#xff0c;成为了开启这座宝藏的关键钥匙&…...

7、三维机械设计、装配与运动仿真组件 - /设计与仿真组件/3d-mechanical-designer

76个工业组件库示例汇总 三维机械设计、装配与运动仿真通用组件 这是一个基于Three.js开发的三维机械设计、装配与运动仿真通用组件&#xff0c;可以实现工业机器人关节结构设计与运动仿真功能。 功能特点 直观的三维设计界面&#xff1a;提供基于WebGL的3D设计空间&#x…...

传统数据展示 vs 可视化:谁更打动人心?

数据&#xff0c;每天都在我们身边流动&#xff1a;从你手机里的健康步数&#xff0c;到企业财报中的营收增长&#xff0c;再到国家发布的经济指标。但问题是——你怎么“看”这些数据&#xff1f; 过去&#xff0c;我们习惯用表格、文字和报告来展示数据&#xff0c;这种方式…...

CSdiy java 07

1 || 运用逻辑运算符 在 Java 代码里&#xff0c;|| 是逻辑或&#xff08;Logical OR&#xff09;运算符&#xff0c;它的作用是对两个布尔表达式进行逻辑或运算。下面结合具体的代码片段来详细说明&#xff1a; 一、|| 的基本含义 在 Java 中&#xff0c;|| 运算符遵循以下…...

从零打造企业级Android木马:数据窃取与远程控制实战

简介 木马病毒已从简单的恶意软件演变为复杂的攻击工具,尤其在2025年企业级攻击中,木马病毒正成为黑客组织的主要武器之一。 本文将深入探讨如何制作具备数据窃取和远程控制功能的Android木马,从基础原理到企业级防御绕过技术,同时提供详细的代码实现,帮助开发者理解木马…...

金仓数据库永久增量备份技术原理与操作

先用一张图说明一下常见的备份方式 为什么需要永久增量备份 传统的数据库备份方案通常是间隔7天对数据库做一次全量备份&#xff08;完整备份&#xff09;&#xff0c;每天会基于全量备份做一次增量备份&#xff0c;如此循环&#xff0c;这种备份方案在全备数据量过大场景下…...

为特定领域微调嵌入模型:打造专属的自然语言处理利器

&#x1f9e0; 向所有学习者致敬&#xff01; “学习不是装满一桶水&#xff0c;而是点燃一把火。” —— 叶芝 我的博客主页&#xff1a; https://lizheng.blog.csdn.net &#x1f310; 欢迎点击加入AI人工智能社区&#xff01; &#x1f680; 让我们一起努力&#xff0c;共创…...

SQLite 转换为 MySQL 数据库

一、导出 SQLite 数据库 1. 使用 SQLite 命令行工具 • 打开终端&#xff08;在 Linux 或 macOS 上&#xff09;或命令提示符&#xff08;在 Windows 上&#xff09;。 • 输入sqlite3 your_database_name.db&#xff08;将 your_database_name.db 替换为你的 SQLite 数据库…...

cnas软件检测实验室质量管理体系文件思维导图,快速理清全部文件

软件检测实验室在申请CNAS资质时&#xff0c;需要根据认可文件的要求&#xff0c;建立实验室质量管理体系&#xff0c;明晰地展示组织架构、合理地安排人员岗位职责和能力要求、全面地覆盖认可文件要求的质量要素。这是一项非常庞大的工作&#xff0c;涉及到的文件类型非常多&a…...

31【干货】Arcgis属性表常用查询表达式实战大全

GIS数据属性表的查询在工作中常常用到&#xff0c;本文对常见的基本运算符进行详细介绍&#xff0c;并以实例的形式&#xff0c;针对SQL查询常用的语句进行实例分类解析&#xff0c;大家可以结合项目需求&#xff0c;自行更改对应的语句&#xff0c;提高工作效率。特别注意文末…...

uniapp 不同路由之间的区别

在UniApp中&#xff0c;路由跳转是实现页面导航的核心功能&#xff0c;常见的路由跳转方式包括navigateTo、redirectTo、reLaunch、switchTab和navigateBack。这些方法在跳转行为和适用场景上有所不同。 一、路由跳转的类型与区别 1. uni.navigateTo(OBJECT) 特点&#xff1…...

前台--Android开发

在 Android 开发中&#xff0c;“前台&#xff08;Foreground&#xff09;” 是一个非常重要的概念&#xff0c;它用于描述当前用户正在与之交互的组件或应用状态。理解“前台”的含义有助于更好地管理资源、生命周期和用户体验。 ✅ 一、什么是前台&#xff1f; 简单定义&…...

python: update() 函数的用法和例子

Python 中 update() 函数的用法和例子 在 Python 中&#xff0c;update() 函数通常用于字典&#xff08;dictionary&#xff09;对象&#xff0c;以更新其键值对。该函数会将另一个字典或可迭代对象中的元素添加到当前字典中&#xff0c;如果键已经存在&#xff0c;则覆盖对应…...

动态规划-62.不同路径-力扣(LeetCode)

一、题目解析 机器人只能向下或向左&#xff0c;要从Start位置到Finish位置。 二、算法原理 1.状态表示 我们要求到Finish位置一共有多少种方法&#xff0c;记Finish为[i,j]&#xff0c;此时dp[i,j]表示&#xff1a;到[i,j]位置时&#xff0c;一共有多少种方法&#xff0c;满…...

排序算法总结

在讲解排序算法之前&#xff0c;我们需要先了解一下排序 所谓排序&#xff0c;就是将数据按照我们的想法将其按照一定规律组合在一起 稳定性&#xff1a;一组数据中的数据是否在排序前后都保持的一定的前后顺序关系&#xff0c;比如在排序前a[3]2 a[5]2&#xff0c;这时他们有着…...

kafka学习笔记(四、生产者、消费者(客户端)深入研究(三)——事务详解及代码实例)

1.事务简介 Kafka事务是Apache Kafka在流处理场景中实现Exactly-Once语义的核心机制。它允许生产者在跨多个分区和主题的操作中&#xff0c;以原子性&#xff08;Atomicity&#xff09;的方式提交或回滚消息&#xff0c;确保数据处理的最终一致性。例如&#xff0c;在流处理中…...

【Git】查看tag

文章目录 1. 查看当前提交是否有tag2. 查看最近的tag3. 查看所有tag 有时候需要基于某个tag拉分支&#xff0c;记录下怎么查看tag。 1. 查看当前提交是否有tag git tag --points-at HEAD该命令可直接检查当前提交&#xff08;HEAD&#xff09;是否关联了任何tag。 若当前提交…...

开源数字人框架 AWESOME - DIGITAL - HUMAN:技术革新与行业标杆价值剖析

一、项目核心价值:解锁数字人技术新境界 1. 技术普及:降低准入门槛,推动行业民主化 AWESOME - DIGITAL - HUMAN 项目犹如一场技术春雨,为数字人领域带来了普惠甘霖。它集成了 ASR、LLM、TTS 等关键能力,并提供模块化扩展接口,将原本复杂高深的数字人开发流程,转化为一…...

Android系统架构模式分析

本文系统梳理Android系统架构模式的演进路径与设计哲学&#xff0c;希望能够借此探索未来系统的发展方向。有想法的同学可以留言讨论。 1 Android层次化架构体系 1.1 整体分层架构 Android系统采用五层垂直架构&#xff0c;各层之间通过严格接口定义实现解耦&#xff1a; 应用…...

【MYSQL错误连接太多】

com.mysql.cj.exceptions.CJException: null, message from server: "Host 192.168.0.200 is blocked because of many connection errors; unblock with mysqladmin flush-hosts"方法一&#xff1a;通过配置文件永久更改 找到你的 MySQL 配置文件&#xff08;通常…...

C23 与 MISRA C:2025:嵌入式 C 语言的进化之路

引言 在 Rust、Go 等现代语言蓬勃发展的今天&#xff0c;C 语言依然以 27.7% 的 TIOBE 指数&#xff08;2024 年 6 月数据&#xff09;稳居编程语言前三甲。其核心竞争力不仅在于高效的底层控制能力&#xff0c;更在于持续进化的标准体系。2024 年发布的 C23&#xff08;ISO/I…...

HunyuanCustom, 腾讯混元开源的多模态定制视频生成框架

HunyuanCustom是一款由腾讯混元团队开发的多模态驱动定制视频生成框架&#xff0c;能够支持图像、音频、视频和文本等多种输入方式。该框架专注于生成高质量的视频&#xff0c;能够实现特定主体和场景的精准呈现。 HunyuanCustom是什么 HunyuanCustom是腾讯混元团队推出的一种…...

el-menu 折叠后小箭头不会消失

官方示例 <template><el-radio-group v-model"isCollapse" style"margin-bottom: 20px"><el-radio-button :value"false">expand</el-radio-button><el-radio-button :value"true">collapse</el-ra…...

Spring Boot中的拦截器!

每次用户请求到达Spring Boot服务端&#xff0c;你是否需要重复写日志、权限检查或请求格式化代码&#xff1f;这些繁琐的“前置后置”工作让人头疼&#xff01;好在&#xff0c;Spring Boot拦截器如同一道智能关卡&#xff0c;统一处理请求的横切逻辑&#xff0c;让代码优雅又…...