当前位置: 首页 > news >正文

探索具身多模态大模型:开发、数据集和未来方向(下)

25年2月来自广东人工智能和数字经济实验室、深圳大学、巴黎理工学院和巴黎高等师范学院、中山大学的论文“Exploring Embodied Multimodal Large Models: Development, Datasets, and Future Directions”。

近年来,具身多模态大模型 (EMLM) 因其在复杂的现实环境中弥合感知、认知和行动之间差距的潜力而备受关注。这篇全面的评论探讨此类模型的发展,包括大语言模型 (LLM)、大型视觉模型 (LVM) 和其他模型,同时也研究其他新兴架构。讨论 EMLM 的发展,重点关注体现感知、导航、交互和模拟。此外,该评论还对用于训练和评估这些模型的数据集进行详细分析,强调多样化、高质量数据对于有效学习的重要性。本文还确定 EMLM 面临的关键挑战,包括可扩展性、泛化和实时决策问题。最后,概述未来的方向,强调整合多模态感知、推理和动作以推动日益自主的系统发展。

。。。。。。继续。。。。。。

具身数据集收集方法

收集具身智能相关的数据集主要有两种方法:一种是使用具有物理身体的智体在现实世界中收集数据,另一种是通过模拟器收集数据集。
该数据集与 [187, 224] 中的数据集类似,是在现实环境中使用各种传感器收集的,包括 RGB 摄像头、深度摄像头、IMU、激光雷达、压力传感器、声音传感器等。然而,在数据收集过程中,可能会出现视野遮挡或操作细节记录不完整等问题。为了应对这些挑战,DexCap [225] 利用 SLAM 来跟踪手部动作。

另一种类型的数据集是使用模拟器收集的,例如 Unity 和 Gazebo。这种方法能够快速生成大量多模态数据(例如图像、深度图、传感器数据等),同时提供对环境和任务变量的控制,从而促进模型训练。

具身感知和交互数据集

最近的几个数据集在推动机器人具身智能的发展方面发挥了关键作用。

值得注意的是,谷歌团队与 20 多个组织和研究机构合作发布的 Open X-Embodiment 数据集 [187] 提供了大规模多模态资源。它包括来自 22 种机器人的数据,捕获 100 万个场景、500 多种技能和 150,000 个任务的 RGB 图像、端点运动轨迹和语言命令。它包含 60 个数据集,其中一些如表所示。

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

具身智能领域很大程度上依赖于捕捉各种机器人操作、环境和传感模式的多样化数据集。这些数据集通常可以根据其数据收集方法进行分类,例如真实世界数据、模拟数据或两者的结合,其中一些数据集包含多模态信息。

总之,这些多样化的数据集,从现实世界到模拟环境,提供丰富的多模式数据,促进具身智能、机器人操控和人机交互的进步。

具身导航数据集

具身导航数据集旨在增强机器人基于视觉-语言组合指令在物理或模拟环境中精确导航的能力。这是通过提供长而复杂的路径和指令、真实世界数据、多样化的室内和室外场景、对训练大型高容量模型的支持以及详细的中间产品(例如 3D 场景重建、相对深度估计、目标标签和定位信息)来实现的。这些数据集有效地扩展了视觉-语言导航的应用场景,并为解决实际的下游应用问题提供了强有力的数据支持。

尽管 EMLM 的发展势头迅猛,但仍面临诸多挑战。然而,它也为未来的探索提供有价值的途径。

技术挑战

跨模态对齐:尽管多模态模型取得了重大进展,但实现不同模态(如视觉、语言和运动)之间的精确高效对齐仍然是一项基本挑战。开发实时稳健地融合和对齐这些模态的方法(特别是针对具体任务)是一个关键的研究重点。例如,当前的视觉-语言模型 ReKep [66] 和视觉-音频模型 SoundSpaces [49] 都依赖于来自不同模态数据的有效对齐。如果没有适当的对齐,响应的准确性和效率可能会降低。

计算资源和效率:EMLM 需要大量的计算资源和存储空间。一个关键挑战是提高计算效率、最大限度地降低能耗、优化推理速度,同时保持高性能。模型压缩、分布式计算和硬件加速方面的进步对于解决这些挑战至关重要。目前,大多数模型都具有大量参数,训练和推理过程都依赖于高性能 GPU,这既耗时又昂贵。然而,Openvla [80] 引入一种方法,让一个只有 70 亿个参数的模型可以执行广泛的任务。当输入包含视觉和语言数据时,这种效率是可以实现的。然而,当加入激光雷达、音频、压力、GPS 和其他多模态输入等其他模态来处理更复杂的任务时,模型大小、响应时间和相关成本往往会显著增加。

跨域泛化:虽然多模态模型在特定基准或特定领域内表现出令人印象深刻的性能,但它们在不同环境或任务中泛化的能力仍然有限。研究人员必须探索方法来增强这些模型在实际应用中的可迁移性和适应性。例如,目前具身大模型通常分为感知模型(如 GPT 系列)、交互模型(如 3D-VLA [179])和导航模型(如 SG-Nav [114])。这些模型可以解决的任务范围相对固定,其泛化能力仍然不是最优的。

处理时间和顺序信息:具身模型必须管理动态、实时数据和顺序交互,在处理连续动作、环境事件以及感知、推理和运动之间的时间依赖关系方面提出重大挑战。在交互领域,模型通常分为短期动作策略(如 R3M [143])和长期动作策略(如 Palm-e [47])。然而,在导航领域,缺乏为长期连续导航而设计的模型。

数据和注释问题

数据集的多样性和质量:现有的具身多模态任务数据集在多样性、规模和质量方面往往受到限制。缺乏能够捕捉动态环境中复杂多模态交互的高质量真实世界数据集,阻碍有效的模型训练。未来的努力应优先考虑开发更大、更多样化、注释更好的数据集,以增强多模态模型的鲁棒性和泛化能力。虽然目前的大型数据集(如 Open X-Embodiment 数据集 [187] 和 ARIO 数据集 [224])取得显著进展,但它们主要侧重于感知和交互任务,例如家务和厨房操作。仅靠这些任务不足以支持具身智能智体所需的全部功能。此外,这些数据集中的大多数传感器都依赖于摄像头,这限制现实世界的感知。为了解决这个问题,必须集成额外的多模态传感器,例如激光雷达、声音传感器、雷达、力传感器和 GPS,以扩大可用数据的广度。

就数据集而言,必须整合现实世界的动态数据。这在具体任务中尤其重要,例如机器人技术和自主系统,由于物理环境的不可预测性,从现实环境中获取数据具有挑战性。为了确保这些模型在现实场景中的实际适用性,必须对准确反映动态非静态环境的数据进行训练。

应用和伦理考虑

自动驾驶和机器人技术:随着具体多模态模型开始在自动驾驶、机器人技术和人机交互中找到应用,确保其安全性、可靠性和道德合规性至关重要。需要解决实时决策、模型输出的可解释性和自主系统风险缓解等挑战。

道德和偏见问题:多模态模型可能会无意中继承训练数据中存在的偏见,从而导致不公平或歧视性的结果。通过开发确保决策过程公平、透明和可问责的方法来解决这些道德问题至关重要。

未来研究方向

跨模态预训练和微调:未来的研究应该探索更有效的跨模态预训练和微调策略,使模型能够在从感知到决策的一系列任务中表现良好,而无需进行大量的再训练。

自我监督学习:自我监督学习技术的发展将是减少对大型标记数据集依赖的关键。通过利用未标记的数据,模型可以学习更丰富的表示,使其更具适应性和可扩展性。

与多模态强化学习的集成:一个有前途的方向是将多模态模型与强化学习(RL)相结合。通过结合感知、动作和反馈回路,具身智体可以不断改进和调整其在动态现实世界环境中的行为。

端到端大模型:目前,有各种针对不同任务设计的大模型,例如感知、导航和交互。然而,未来的发展趋势是朝着端到端大模型发展,其中单个模型处理所有事情——从处理输入指令到执行最终任务。这种方法简化了流程并提高了效率。

相关文章:

探索具身多模态大模型:开发、数据集和未来方向(下)

25年2月来自广东人工智能和数字经济实验室、深圳大学、巴黎理工学院和巴黎高等师范学院、中山大学的论文“Exploring Embodied Multimodal Large Models: Development, Datasets, and Future Directions”。 近年来,具身多模态大模型 (EMLM) 因其在复杂的现实环境中…...

14 结构体

结构体 结构体是什么? 在前面我们学习过基础的数据类型int float char 等,都只能用来表示基础的数据类型,那么要怎么来表示复杂的数据类型呢? 比如学生信息: 学号姓名性别年龄总分数100maye男18666101椰汁女19555 …...

如何配置 Docker 以实现无需 sudo 使用

1. 背景知识:为什么需要 sudo? Docker 是一个容器化平台,其核心组件包括: Docker 守护进程(dockerd):负责管理容器的创建、运行和销毁。Docker CLI:用户通过命令行工具&#xff08…...

嵌入式开发之STM32学习笔记day06

基于STM32F103C8T6的开发实践——从入门到精通01 1. 引言 STM32系列微控制器是STMicroelectronics推出的一款高性能、低功耗的32位微控制器,广泛应用于嵌入式系统中。STM32F103C8T6是其中非常受欢迎的一款,凭借其强大的性能、丰富的外设接口和低廉的价格…...

openocd C#桌面工具

文章目录 简介一、主界面二、文件列表三、rtl介绍四、虚拟示波器1、画线2、画点3、合并显示4、测试代码简介 基于廉价9.9包邮的DAP-Link,在IAR和Keil中下载和调试都没毛病。 可是不能单独使用。单独烧录固件用不了,也不能同jlink一样打印日志和显示波形。 openocd开源工具能…...

goland小问题报错及解决

报错信息: cannot use rw (variable of type *populateResponse) as ResponseWriter value in argument to t.fh.ServeHTTP: *populateResponse does not implement ResponseWriter (missing method Fprintf) cannot use rw (variable of type *http2responseWrite…...

AtCoder Beginner Contest 397 A - D题解

Tasks - OMRON Corporation Programming Contest 2025 (AtCoder Beginner Contest 397) 本文为 AtCoder Beginner Contest 397 A - D题解 题目A: 代码(C): #include <bits/stdc.h>int main() {double n;std::cin >> n;if (n > 38.0) {std::cout << 1;}…...

18年老牌软件,完美解锁pro!

很多小伙伴在学习、工作中都喜欢使用思维导图来整理和记录自己的思路&#xff0c;通过图形化的方式展示复杂概念和关系&#xff0c;使信息更加清晰易懂&#xff0c;有助于理解和记忆&#xff1b;其次&#xff0c;分层次和分类别的信息结构也能够快速理清思路&#xff0c;突出重…...

Power Apps 技术分享:画布应用使用表单控件

前言 表单控件&#xff0c;是画布应用里一个非常好用的控件&#xff0c;我们今天简单介绍下&#xff0c;如何使用这个控件。 正文 1.首先&#xff0c;我们需要有一个数据源&#xff0c;我们这里用上一篇博客新建的数据源&#xff0c;如下图&#xff1a; 2.新建一个页面&#xf…...

视频转音频, 音频转文字

Ubuntu 24 环境准备 # 系统级依赖 sudo apt update && sudo apt install -y ffmpeg python3-venv git build-essential python3-dev# Python虚拟环境 python3 -m venv ~/ai_summary source ~/ai_summary/bin/activate核心工具链 工具用途安装命令Whisper语音识别pip …...

ZLMediaKit源码分析——[1] 开篇:onceToken源码分析

系列文章目录 第一篇 基于SRS 的 WebRTC 环境搭建 第二篇 基于SRS 实现RTSP接入与WebRTC播放 第三篇 centos下基于ZLMediaKit 的WebRTC 环境搭建 第四篇 WebRTC学习一:获取音频和视频设备 第五篇 WebRTC学习二:WebRTC音视频数据采集 第六篇 WebRTC学习三:WebRTC音视频约束 …...

EasyRTC嵌入式音视频通话SDK:微信生态支持、轻量化架构与跨平台兼容性(Linix/Windows/ARM/Android/iOS/LiteOS)

随着WebRTC技术的不断发展&#xff0c;实时音视频通信在各个领域的应用越来越广泛。EasyRTC嵌入式音视频通话SDK作为一款基于WebRTC技术的实时通信解决方案&#xff0c;凭借其强大的功能和灵活的集成能力&#xff0c;受到了越来越多开发者的关注。 一、系统架构设计 纯C语言开…...

Python中使用vlc库实现视频播放功能

文章目录 前言1. 环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库 2. 基础播放示例3. 常用播放控制功能4. 事件监听5. 播放网络流媒体6. 结合 GUI 库制作视频播放器&#xff08;以 Tkinter 为例&#xff09; 前言 本教程主要包含打开文件、播放和停止按钮&#xff0…...

Elasticsearch面试题

以下是150道Elasticsearch面试题及其详细回答&#xff0c;涵盖了Elasticsearch的基础知识、配置与优化、查询操作、集群管理、性能调优等多个方面&#xff0c;每道题目都尽量详细且简单易懂&#xff1a; Elasticsearch基础概念类 1. 什么是Elasticsearch&#xff1f; Elastics…...

Linux上位机开发实战(qt编译之谜)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 很多同学都喜欢用IDE&#xff0c;也能理解。因为不管是visual studio qt插件&#xff0c;还是qt creator其实都帮我们做了很多额外的工作。这里面最…...

SpringBoot3+Druid+MybatisPlus多数据源支持,通过@DS注解配置Service/Mapper/Entity使用什么数据源

在 Spring Boot 3 中结合 Druid 和 MyBatis-Plus 实现多数据源支持&#xff0c;并通过 DS 注解动态切换数据源&#xff0c;可以按照以下步骤进行配置&#xff1a; 官方文档&#xff1a;多数据源支持 | MyBatis-Plus 1. 引入依赖 在 pom.xml 中添加以下依赖&#xff1a; <…...

Java学习------内部类

1. 定义 定义在一个类中的类 2. 使用时机 当一个类需要用到另一个类&#xff0c;并且两个类的联系比较密切时就需要使用内部类内部类可以访问外部类的私有成员&#xff0c;这样可以将相关的类和接口隐藏在外部类的内部&#xff0c;提高封装性匿名内部类是没有名字的类&#…...

【QA】建造者模式在Qt有哪些应用

#设计模式 #Qt 一、QDomDocument&#xff08;XML 文档构建&#xff09; 模式角色&#xff1a; Builder&#xff1a;QDomDocument 本身Product&#xff1a;XML 文档对象Director&#xff1a;用户代码通过 QDomDocument 逐步构建文档结构 示例代码&#xff1a; QDomDocument…...

uniapp 多环境配置打包,比较优雅的解决方案,全网相对优解

uniapp 多环境配置打包&#xff0c;比较优雅的解决方案&#xff0c;全网相对优解 读取.env.[development|test|staging|production]配置文件进行打包&#xff0c;最终效果如下图可以看到多个环境&#xff0c; 并且我们可以自定义更多的环境配置 前言 由于uniapp的hbuilder开发…...

【量化科普】Liquidity,流动性

【量化科普】Liquidity&#xff0c;流动性 &#x1f680;量化软件开通 &#x1f680;量化实战教程 在金融市场中&#xff0c;流动性&#xff08;Liquidity&#xff09;是一个至关重要的概念。它指的是资产能够以多快的速度被买入或卖出而不显著影响其价格的能力。高流动性的…...

qt介绍图表 charts 一

qt chartsj基于Q的Graphics View框架&#xff0c;其核心组件是QChartView和QChart.QChartView是一个显示图表的独立部件&#xff0c;基类为QGraphicsView.QChar类管理图表的序列&#xff0c;图例和轴示意图。 绘制一个cos和sin曲线图&#xff0c;效果如下 实现代码 #include…...

如何图像去噪?(一)

喜欢可以在我的主页订阅专栏哟&#xff0c;至少更新6年~~&#xff0c;更到我上大学也可能会继续更~~ 第一章 图像去噪的基础知识与核心概念 1.1 图像噪声的数学模型与物理成因 定义扩展&#xff1a; 图像噪声是信号采集、传输或存储过程中引入的随机干扰&#xff0c;其本质为…...

【数据库】Data Model(数据模型)数据模型分析

理解图片中的 Data Model&#xff08;数据模型&#xff09;是学习数据库设计和应用程序开发的重要一步。作为初学者&#xff0c;你可以通过比喻和简单的解释来理解这些概念以及它们之间的联系。以下是对图片中数据模型的详细分析&#xff0c;以及如何理解它们之间的关系。 1. 数…...

win10 c++ VsCode 配置PCL open3d并显示

win10 c VsCode配置PCL open3d并显示 一、效果图二、配置步骤2.1 安装vscode2.2 pcl-open3d配置2.3 vscode中设置 三、测试代码四、注意事项及后续 一、效果图 二、配置步骤 2.1 安装vscode vscode下载链接 下载中文插件、c相关插件 2.2 pcl-open3d配置 1&#xff09;下载…...

Flask多参数模版使用

需要建立目录templates&#xff1b; 把建好的html文件放到templates目录里面&#xff1b; 约定好参数名字&#xff0c;单个名字可以直接使用&#xff1b;多参数使用字典传递&#xff1b; 样例&#xff1a; from flask import render_template # 模板 (Templates) #Flask 使用…...

python中a is None 和 a==None有区别吗

在 Python 中&#xff0c;a is None 和 a None 的区别如下&#xff1a; 1. a is None 这是身份&#xff08;identity&#xff09;比较&#xff0c;用于检查 a 是否就是 None 这个对象。None 是 Python 的单例对象&#xff0c;意味着在 Python 运行过程中&#xff0c;所有 No…...

Excel(函数篇):COUNTIF与CONUTIFS函数、SUMIF与SUMIFS函数、ROUND函数、MATCH与INDEX函数、混合引用与条件格式

目录 COUNTIF和COUNTIFS函数COUNTIF函数COUNTIFS函数SUMIF和SUMIFS函数SUMIF函数SUMIFS函数SUMIFS函数与控件实现动态年月汇总ROUND、ROUNDUP、ROUNDDOWN函数单元格混合引用条件格式与公式,标记整行数据MATCH和INDEX函数COUNTIF和COUNTIFS函数 COUNTIF函数 统计下“苏州”出现…...

C语言及内核开发中的回调机制与设计模式分析

在C语言以及操作系统内核开发中,回调机制是一种至关重要的编程模式。它通过注册框架和定义回调函数,实现了模块间的解耦和灵活交互,为系统的扩展性和可维护性提供了有力支持。本文将深入探讨这种机制的工作原理、应用场景以及与设计模式的关联。 一、回调机制的核心概念 (…...

SAP WORKFLOW BUSINESS PROCESS AUTOMATION

SAP WORKFLOW BUSINESS PROCESS AUTOMATION...

它,让机器人与HMI屏无缝对接

随着工业自动化向智能化发展&#xff0c;机器人与HMI屏的通信变得至关重要。本文将为您介绍一款创新的解决方案&#xff0c;它打破了通信协议的壁垒&#xff0c;实现机器人与HMI屏的无缝连接。 随着工业自动化向智能化的迈进&#xff0c;生产制造业正加速引入大量工业机器人以替…...

Vala语言基础知识-源文件和编译

源文件和编译 Vala代码‌以.vala为扩展名。与Java等语言不同&#xff0c;Vala‌不强制要求严格的文件结构‌——它没有类似Java的"包"&#xff08;package&#xff09;或"类文件"&#xff08;class file&#xff09;的概念&#xff0c;而是通过文件内的文本…...

《mc百科》小引

现在的年轻人&#xff0c;不是玩农药&#xff0c;就是在打和平&#xff0c;几乎每到街上&#xff0c;想就看见农药上号的&#xff0c;但这些游戏&#xff0c;虽然宜人&#xff0c;但随时都能让人异化。 但有一种游戏&#xff0c;可以说几乎涵盖了所有文化。早其自由度高达999%…...

java泛型通配符?及上下界(extends,super)保证安全性、灵活性、可读性

在 Java 中&#xff0c;泛型通配符&#xff08;?&#xff09;用于表示未知类型&#xff0c;通常用于增强泛型的灵活性。通配符可以与上下限结合使用&#xff0c;以限制泛型的范围。以下是通配符及上下限的使用示例&#xff1a; 1. 无界通配符 (?) 无界通配符表示可以接受任意…...

PyQt6内嵌http.server Web 和Flask Web服务器方法详解

PyQt6 可以内嵌一个简单的 Web 服务器。虽然 PyQt6 本身不提供直接的 Web 服务器功能&#xff0c;但可以结合 Python 的标准库&#xff08;如 http.server&#xff09;或其他 Web 框架&#xff08;如 Flask、FastAPI 等&#xff09;来实现。 示例&#xff1a;使用 http.server…...

【ProjectDiscovery 生态中核心工具 Subfinder、Httpx、Katana 和 Nuclei 的基础使用教程】

ProjectDiscovery 生态中核心工具 Subfinder、Httpx、Katana 和 Nuclei 的基础使用教程 一、Subfinder&#xff1a;子域名发现工具安装基础使用 二、Httpx&#xff1a;HTTP 探测与指纹识别安装基础使用 三、Katana&#xff1a;网络爬虫工具安装基础使用 四、Nuclei&#xff1a;…...

【Linux系统】进程地址空间详解

Linux系列 文章目录 Linux系列前言一、地址空间的区域划分二、进程地址空间的引入2.1 地址空间的概念2.2 地址空间2.3 进程地址空间的优点 三、页表3.1 区域权限管理3.2 惰性加载 总结 前言 进程地址空间是操作系统为每个运行中的进程分配的一个虚拟内存视图&#xff0c;它是所…...

使用Dependency Walker和Beyond Compare快速排查dll动态库损坏或被篡改的问题

目录 1、问题描述 2、用Dependency Walker工具打开qr.dll库&#xff0c;查看库与库的依赖关系以及接口调用情况&#xff0c;定位问题 3、使用Beyond Compare工具比较一下正常的msvcr100d.dll和问题msvcr100d.dll的差异 4、最后 C软件异常排查从入门到精通系列教程&#xff…...

蓝桥杯 刷题统计

问题描述 小明决定从下周一开始努力刷题准备蓝桥杯竞赛。他计划周一至周五每天 做 a 道题目, 周六和周日每天做 b 道题目。请你帮小明计算, 按照计划他将在 第几天实现做题数大于等于 n 题? 输入格式 输入一行包含三个整数 a,b和 n. 输出格式 输出一个整数代表天数。 样…...

019-RSA

RSA 一、RSA技术原理与流程&#xff08;附流程图&#xff09; 密钥生成流程 graph TDA[选择大质数p/q] --> B[计算np*q]B --> C[计算 “φ&#xff08;n&#xff09;p-1*q-1”]C --> D[选择e与φ&#xff08;n&#xff09;互质]D --> E[计算d满足ed≡1 mod φ&am…...

《 C++ 点滴漫谈: 三十一 》函数重载不再复杂:C++ 高效调试与性能优化实战

摘要 本篇博客深入探讨了 C 中的函数重载及其调试技巧。首先&#xff0c;介绍了函数重载的基本概念及其在 C 编程中的应用&#xff0c;强调了如何通过函数重载提高代码的灵活性和可读性。接着&#xff0c;我们讨论了函数重载的常见问题&#xff0c;如二义性、隐式类型转换和重…...

2024年消费者权益数据分析

&#x1f4c5; 2024年315消费者权益数据分析 数据见&#xff1a;https://mp.weixin.qq.com/s/eV5GoionxhGpw7PunhOVnQ 一、引言 在数字化时代&#xff0c;消费者维权数据对于市场监管、商家诚信和行业发展具有重要价值。本文基于 2024年315平台线上投诉数据&#xff0c;采用数…...

uniapp APP权限弹框

效果图 第一步 新建一个页面&#xff0c;设置透明 {"path": "pages/permissionDisc/permissionDisc","style": {"navigationBarTitleText": "","navigationStyle": "custom","app-plus": {&…...

【Weaviate】数据库:向量存储与搜索的新纪元

&#x1f407;明明跟你说过&#xff1a;个人主页 &#x1f3c5;个人专栏&#xff1a;《深度探秘&#xff1a;AI界的007》 &#x1f3c5; &#x1f516;行路有良友&#xff0c;便是天堂&#x1f516; 目录 一、引言 1、什么是Weaviate 2、Weaviate 能做什么&#xff1f; …...

机器学习之激活函数

什么是激活函数 激活函数是神经网络的关键组件&#xff0c;作用于神经元输出。神经元汇总输入并计算净输入值&#xff0c;激活函数将其非线性变换&#xff0c;生成神经元最终输出&#xff0c;该输出作为后续神经元输入在网络中传播。 为什么需要激活函数 引入非线性 无激活…...

ACWing:178. 第K短路 (A*算法)

178. 第K短路 - AcWing题库 ac代码&#xff1a; #include<iostream> #include<cstring> #include<queue> using namespace std; const int N1010; const int M20020; struct node{int d,end,d1;bool operator <(const node &x)const{return d>x.d…...

Windows 图形显示驱动开发-WDDM 3.0功能- 硬件翻转队列(一)

WDDM 3.0 之前的翻转队列模型 许多新式显示控制器支持对按顺序显示的多个帧排队的能力。 从 WDDM 2.1 开始&#xff0c;OS 支持将在下一个 VSync 中显示的多个未完成的翻转覆盖请求。 显示微型端口驱动程序 (KMD) 通过 DXGK_DRIVERCAPS 中的 MaxQueuedMultiPlaneOverlayFlipVS…...

本地仓库设置

将代码仓库初始化为远程仓库&#xff0c;主要涉及在服务器上搭建 Git 服务&#xff0c;并将本地代码推送到服务器上。以下是详细的步骤&#xff1a; 1. 选择服务器 首先&#xff0c;你需要一台服务器作为代码托管的远程仓库。服务器可以是本地服务器、云服务器&#xff0c;甚…...

openEuler系统迁移 Docker 数据目录到 /home,解决Docker 临时文件占用大问题

根据错误信息 write /var/lib/docker/tmp/...: no space left on device&#xff0c;问题的根源是 根分区&#xff08;/&#xff09;的磁盘空间不足&#xff0c;而非 /home 分区的问题。以下是详细解释和解决方案&#xff1a; 问题原因分析 Docker 临时文件占用根分区空间&…...

LoRA有哪些 参数高效微调方法?

LoRA有哪些 参数高效微调方法? 目录 LoRA有哪些 参数高效微调方法?一、**Fisher 信息矩阵(FIM)近似方差**公式原理LoRA 应用示例二、**动态梯度方差(指数加权移动平均)**公式原理LoRA 代码示例三、**分层梯度方差(结构稀疏性)**公式原理案例:文本分类任务四、**局部方…...

【Xinference rerank】学习如何在Xinference中使用重新排序模型

xinferance 官方网站 给定一个查询和一系列文档&#xff0c;Rerank 会根据与查询的语义相关性从最相关到最不相关对文档进行重新排序。在 Xinference 中&#xff0c;可以通过 Rerank 端点调用 Rerank 模型来对一系列文档进行排序。 from xinference.client import Clientclie…...