湖南大学3D场景问答最新综述!3D-SQA:3D场景问答助力具身智能场景理解
-
作者: Zechuan Li, Hongshan Yu, Yihao Ding, Yan Li, Yong He, Naveed Akhtar
-
单位:湖南大学,墨尔本大学,悉尼大学,安徽大学
-
论文标题:Embodied Intelligence for 3D Understanding: A Survey on 3D Scene Question Answering
-
论文链接:https://arxiv.org/pdf/2502.00342
主要贡献
-
首次全面综述:这是首篇对3D SQA领域进行系统性回顾的综述论文,涵盖了数据集、方法论和评估指标。
-
数据集与方法论的系统分类:对现有的3D SQA数据集和方法进行了详细的分类和比较,总结了它们的特点、优势和局限性。
-
挑战与机遇分析:深入分析了当前3D SQA领域面临的主要挑战,如数据集标准化、多模态融合和任务设计,并提出了未来的研究方向。
-
评估指标的讨论:探讨了传统评估指标和基于大模型(LLM)的评估指标的优缺点,并提出了结合两者的优势以构建更全面的评估框架。
介绍
研究背景与动机
- 传统视觉问答(VQA)的局限性
-
传统VQA主要结合视觉内容(如图像)与文本问答,但仅限于二维图像的理解,难以满足对复杂三维环境的交互需求。
-
- 3D场景问答(3D SQA)的兴起
-
3D SQA通过整合视觉感知、空间推理和语言理解,使智能体能够在三维环境中进行复杂推理。例如,它可以帮助机器人在室内环境中根据自然语言指令找到特定物体,或者在虚拟环境中为用户提供交互式的信息查询服务。
-
3D SQA推动了多模态人工智能的发展,为机器人技术、增强现实和自主导航等领域提供了新的可能性。
-
研究现状与挑战
- 数据集和方法的快速发展
-
近年来,随着大视觉 - 语言模型(LVLM)的发展,3D SQA领域出现了多种数据集,如ScanQA、SQA等,并发展出了指令微调和零样本学习方法。
-
- 面临的挑战
-
数据集之间的差异较大,缺乏统一的分析和比较标准。例如,不同的数据集在场景表示(点云、多视角图像等)、查询复杂性(从简单的文本到复杂的多模态查询)和任务类型(从基础的对象识别到复杂的导航和规划任务)方面存在显著差异。
-
方法的多样性和复杂性也增加了比较和评估的难度。早期方法主要依赖于定制的架构和人工标注的数据,而最近的方法则更多地利用预训练模型和自动化数据生成技术。
-
预备知识
3D SQA任务的核心是理解3D场景和查询,生成文本答案和可选的空间信息。具体定义如下:
- 输入
-
3D场景(S):可以用点云(S(p))或多种视角的图像(S(m))表示,也可以是两者的组合。
-
查询(Q):可以是文本(Q(t)),也可以包含第一人称图像(Q(e))或对象级点云(Q(o))。
-
- 输出
-
文本答案(T):对查询的文本回复。
-
空间信息(B):如相关对象的3D边界框,用于空间定位。
-
-
任务函数(F):将输入的场景和查询映射到输出的答案和空间信息,即F : (S,Q) → (T,B)。这个函数需要整合多模态推理和空间理解,以实现对3D场景的全面分析。
数据集
数据集结构
- 场景模态和规模
-
合成3D数据集:早期的3D SQA数据集主要基于合成环境,如EmbodiedQA和IQA,它们利用虚拟环境生成场景和问题,适合初步研究和算法验证。
-
点云数据集:如ScanQA和SQA,基于真实世界的3D扫描数据(如ScanNet),提供了更接近实际应用的场景和问题,适合研究点云处理和空间理解。
-
多视角数据集:如3DMV-VQA和OpenEQA,通过从多个视角渲染图像来表示3D场景,更符合人类的视觉感知方式,适合研究多视角融合和视觉 - 语言对齐。
-
多模态数据集:如Spartun3D和MSQA,整合了点云、图像和文本等多种模态的数据,能够提供更丰富的上下文信息,适合研究复杂的多模态交互和推理任务。
-
- 查询模态和复杂性
-
基本文本查询:早期数据集主要使用简单的文本查询,如“房间里有多少把椅子?”这类查询关注场景级属性,不涉及智能体的位置或交互。
-
以智能体为中心的查询:如SQA3D引入了描述智能体位置和方向的查询,如“坐在床边,面对沙发”,增加了任务的复杂性和交互性。
-
多模态查询:最近的数据集开始结合文本、图像和空间信息等多种模态,如Spartun3D和MSQA,使查询更加丰富和真实。
-
QA对生成
- 生成方法
-
模板生成:通过预定义的模板和程序化的方法生成问答对,如ScanQA利用T5模型和ScanRefer数据集生成种子问题。这种方法可以快速生成大规模数据集,但生成的问题可能缺乏多样性。
-
人工标注:通过人工标注生成问答对,如SQA和FE-3DGQA,虽然标注成本较高,但能够保证问题的质量和多样性。
-
LLM辅助生成:利用大模型(如GPT-3)生成问答对,如Spartun3D和MSQA。这种方法结合了LLM的强大生成能力和人工标注的准确性,能够生成高质量且多样化的问答对。
-
评估指标
传统指标
-
精确匹配(Exact Match,EM):衡量生成答案与真实答案是否完全一致。例如,EM@1表示生成的最可能答案与真实答案完全匹配的比例,EM@10表示前10个生成答案中至少有一个与真实答案完全匹配的比例。
-
语言生成指标:包括BLEU(用于衡量生成文本与参考文本的相似度)、ROUGE-L(用于评估生成文本与参考文本的重叠程度)、METEOR(综合考虑词汇匹配、词义匹配等多种因素)和CIDEr(用于评估生成文本的语义相关性)。这些指标主要用于评估生成答案的语言质量和多样性。
基于LLM的指标
-
Mean Relevance Score:如OpenEQA使用GPT评估生成答案的上下文相关性和正确性,通过计算生成答案与真实答案之间的语义相似度来衡量模型的性能。
-
基于GPT的评分:如MSQA使用GPT评估答案的质量,通过判断生成答案是否符合上下文逻辑和语义要求来给出评分。这种方法能够更好地捕捉生成答案的语义细节和上下文一致性。
3D SQA方法分类
任务特定方法
- 点云方法
-
这些方法主要针对点云数据进行处理,通常采用模块化的处理流程:场景编码、查询编码、特征融合和答案预测。例如,ScanQA使用VoteNet和PointNet++提取点云的空间特征,用BiLSTM和BERT对文本查询进行编码,然后通过Transformer模块进行特征融合,最后通过MLP预测答案。
-
3DQA-TR进一步优化了这一流程,用Group-Free替代VoteNet,采用BERT对查询进行编码,增强了特征融合的效果。
-
- 多视角和2D - 3D方法
-
一些方法结合多视角图像和点云数据来提高性能。例如,3D-CLR通过多视角图像构建紧凑的3D场景表示,优化3D体素网格,从而更好地对齐视觉和语言特征。
-
BridgeQA则结合2D图像特征和3D对象特征,通过预训练的视觉 - 语言模型(如BLIP)对文本进行编码,然后通过视觉 - 语言Transformer进行特征融合,生成自由形式的答案。
-
基于预训练的方法
- 传统预训练方法
-
这些方法侧重于对齐3D空间特征与2D视觉和语言表示。例如,Parelli等人的方法利用可训练的3D场景编码器(基于VoteNet)提取对象级特征,并通过Transformer层建模对象间关系,增强多模态特征的对齐。
-
Multi-CLIP通过多视角渲染和对比学习,进一步优化了3D空间特征与2D表示的整合,提高了模型对多模态数据的理解能力。
-
- 指令微调方法
-
这些方法利用预训练的LLM或VLM作为冻结编码器,通过轻量级的任务特定层进行微调,以适应下游任务。例如,LM4Vision使用冻结的LLaMA编码器,训练轻量级的任务特定层以对齐3D QA任务。
-
LEO、M3DBench和LAMM等方法利用Vicuna(LLaMA的衍生模型)进行指令微调,通过对象级和场景级的描述增强多模态推理能力。
-
零样本学习方法
- 文本驱动方法
-
将3D场景信息转换为文本描述,然后与问题一起输入预训练的LLM或VLM进行零样本推理。例如,SQA3D使用Scan2Cap生成场景描述并输入GPT-3进行问答。这种方法虽然灵活且成本较低,但对3D空间信息的利用有限。
-
- 图像驱动方法
-
利用VLM将视觉特征(如图像或多视角数据)与文本结合进行推理。例如,MSQA使用GPT-4o与VLM结合,通过图像特征增强对场景的理解。这种方法能够更好地利用视觉信息,但仍依赖于文本描述来表达空间关系。
-
- 多模态对齐方法
-
在预训练阶段显式对齐视觉和文本信息,以提高零样本性能。例如,LEO和Spartun3D-LLM通过增强对象级和场景级特征对齐,使模型能够更好地理解和推理3D场景与文本之间的关系。这种方法虽然性能较好,但计算资源需求较高。
-
挑战与未来工作
数据集质量和标准化
- 挑战
-
目前3D SQA数据集发展迅速,但存在范围和模态不一致的问题,缺乏统一的基准和评估标准。
-
LLM生成数据集时可能会引入幻觉信息和上下文错位,影响数据质量。
-
- 未来工作
-
需要整合现有的数据集,构建统一的基准,以便进行标准化评估。
-
开发更强大的验证框架,利用人工标注或LLM作为验证器,确保数据集的质量和可靠性。
-
零样本学习中的3D意识增强
- 挑战
-
当前零样本模型过度依赖文本代理,对3D空间和几何特征的利用有限,难以处理复杂的3D任务。
-
- 未来工作
-
探索能够深度融合3D特征与语言和视觉模态的架构,提高模型在多样化任务中的泛化能力。
-
研究如何更好地平衡多模态对齐和预训练模型在零样本3D SQA中的作用,以提高效率和性能。
-
统一评估
- 挑战
-
缺乏针对3D SQA目标的标准化和专用评估指标,难以在不同数据集和模型之间进行有意义的比较。
-
- 未来工作
-
开发统一的评估框架,纳入多模态指标,涵盖空间推理、上下文准确性和特定任务性能等方面,以便更准确地进行基准测试和推动方法创新。
-
动态和开放世界场景
- 挑战
-
大多数现有方法和数据集关注静态、预定义的环境,限制了其在现实世界任务中的适用性。
-
- 未来工作
-
关注动态、开放世界设置,使模型能够处理实时场景变化和新问题。
-
结合具身交互(如导航和多步推理),使3D SQA系统更接近现实世界的需求。
-
可解释和可解释的3D SQA模型
- 挑战
-
当前的3D SQA模型通常被视为“黑箱”,限制了其在医疗保健等信任关键领域的应用。
-
- 未来工作
-
开发能够可视化3D特征、突出相关区域或提供自然语言解释的可解释模型,增强用户信任并扩大其应用范围。
-
多模态交互与协作
- 挑战
-
3D SQA系统正朝着更自然和交互式的界面发展,但目前的研究还相对较少。
-
- 未来工作
-
探索整合语言、手势和视觉输入,实现与3D场景的直观交互。
-
研究协作场景(如建筑设计或教育训练)中多个用户实时与系统互动的可能性,为3D SQA开拓更广泛的应用。
-
纳入时间动态
- 挑战
-
大多数3D SQA模型目前忽略了场景的时间动态,而现实世界中的许多应用(如交通监控、机器人导航)都涉及动态环境。
-
- 未来工作
-
研究如何将时间动态纳入3D SQA,使模型能够推理场景随时间的变化。
-
利用时间信息(如物体运动)处理需要长期时间推理的任务,提高模型在动态环境中的适应性。
-
模型效率和部署
- 挑战
-
部署3D SQA系统到资源受限的设备(如移动机器人和边缘AI代理)上存在困难,因为这些模型通常需要较高的计算和内存资源。
-
- 未来工作
-
研究轻量级架构和优化技术,如剪枝、量化和知识蒸馏,以实现高效和实时的推理。
-
开发适用于嵌入式系统的节能算法和可扩展设计,提高3D SQA在实际应用中的可行性。
-
相关文章:
湖南大学3D场景问答最新综述!3D-SQA:3D场景问答助力具身智能场景理解
作者: Zechuan Li, Hongshan Yu, Yihao Ding, Yan Li, Yong He, Naveed Akhtar 单位:湖南大学,墨尔本大学,悉尼大学,安徽大学 论文标题:Embodied Intelligence for 3D Understanding: A Survey on 3D Sce…...
【PyTorch】深度学习实践——第二章:线性模型
参考:刘二老师的《PyTorch深度学习实践》完结合集 本章实现了一个简单的线性回归模型,用于学习输入x和输出y之间的线性关系(yw*x)。 一、代码细节 1.数据准备 x_data [1.0, 2.0, 3.0] y_data [2.0, 4.0, 6.0]定义了训练数据,x和y之间显然…...
【Python 中文编码】
在 Python 中处理中文编码问题时,需重点关注文件编码声明、字符串编码转换及环境配置。以下是分步指南和最佳实践: 一、Python 3 的默认编码行为 Python 3.x:默认使用 UTF-8 编码(与 Python 2.x 的 ASCII 默认编码不同࿰…...
Excel宏和VBA
Excel宏和VBA(Visual Basic for Applications)是自动化Excel操作的强大工具,可帮助用户批量处理数据、自定义功能、提升效率。以下是详细使用方法及示例: --- ### **一、基础操作** #### 1. **录制宏** - **步骤**࿱…...
1688 API 接口使用限制
在使用 1688 API 接口时,需要注意以下几方面的限制和注意事项,以确保合规使用并避免不必要的问题。 一、调用频率限制 1688 平台对 API 接口的调用频率通常有限制,以防止滥用和对服务器造成过大压力。具体限制如下: 免费版&…...
5. 动画/过渡模块 - 交互式仪表盘
5. 动画/过渡模块 - 交互式仪表盘 案例:数据分析仪表盘 <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title></head><style type"text/css">.dashboard {font-family: Arial…...
数据擦除标准:1-Pass vs. 3-Pass vs. 7-Pass有什么区别,哪个更好?
虽然像美国国防部(DoD)5220.22-M这样的旧标准提倡多次覆盖,但像NIST 800-88和新兴的IEEE 2883标准这样的新指南已经改变了对数据擦除效果的看法。在这篇博客中,我们解释了不同的擦除方法,并分析了旧标准在新时代是否仍然相关。 理解数据擦除方法 数据擦除包括用0、1或随…...
MySQL推荐书单:从入门到精通
给大家介绍一些 MySQL 从入门到精通的经典书单,可以基于不同学习阶段的需求进行选择。 入门 MySQL必知必会 这本书继承了《SQL必知必会》的优点,专门针对 MySQL 用户,没有过多阐述数据库基础理论,而是紧贴实战,直接从…...
Rodrigues旋转公式-绕任意轴旋转
Rodrigues旋转公式 给定旋转轴单位向量 k ( k x , k y , k z ) \mathbf{k}(k_x,k_y,k_z) k(kx,ky,kz)和旋转角度 θ \theta θ,旋转矩阵 R R R可以表示为: R I sin θ K ( 1 − cos θ ) K 2 RI\sin \theta K(1-\cos \theta)K^2 RIsin…...
【大模型面试每日一题】Day 17:解释MoE(Mixture of Experts)架构如何实现模型稀疏性,并分析其训练难点
【大模型面试每日一题】Day 17:解释MoE(Mixture of Experts)架构如何实现模型稀疏性,并分析其训练难点 📌 题目重现 🌟🌟 面试官:解释MoE(Mixture of Experts)架构如何…...
Datawhale 5月coze-ai-assistant 笔记1
课程地址: coze-ai-assistant-课程摘要 | Datawhalehttps://www.datawhale.cn/learn/summary/105 动手实践 链接:https://www.coze.cn/home 作业:智能体链接地址扣子扣子是新一代 AI 大模型智能体开发平台。整合了插件、长短期记忆、工作…...
2025.5.13总结
想要成为自己想要成为的那个人,并不是一件容易的事情。在我报口才课的时候,老师一针见血的指出了我的不足。因为不敢,所以不做,因为不去做,所以不会,而正因为不会,也导致了你不敢。当我听到这个…...
spring中的@Async注解详解
一、核心功能与作用 Async 是Spring框架提供的异步方法执行注解,用于将方法标记为异步任务,使其在独立线程中执行,从而提升应用的响应速度和吞吐量。其主要作用包括: 非阻塞调用:主线程调用被标记方法后立即返回&…...
计算机视觉----时域频域在图像中的意义、傅里叶变换在图像中的应用、卷积核的频域解释
1、时域(时间域)——自变量是时间,即横轴是时间,纵轴是信号的变化。其动态信号x(t)是描述信号在不同时刻取值的函数。 2、频域(频率域)——自变量是频率,即横轴是频率,纵轴是该频率信号的幅度,也就是通常说…...
分布式链路跟踪
目录 链路追踪简介 基本概念 基于代理(Agent)的链路跟踪 基于 SDK 的链路跟踪 基于日志的链路跟踪 SkyWalking Sleuth ZipKin 链路追踪简介 分布式链路追踪是一种监控和分析分布式系统中请求流动的方法。它能够记录和分析一个请求在系统中经历的每…...
从数据中台到数据飞轮:实现数据驱动的升级之路
从数据中台到数据飞轮:实现数据驱动的升级之路 随着数字化转型的推进,数据已经成为企业最重要的资产之一,企业普遍搭建了数据中台,用于整合、管理和共享数据;然而,近年来,数据中台的风潮逐渐减退…...
深入解析Java序列化:从使用到原理
在此之前,对于 Java 中的序列化,我一直停留在使用层面 —— 把需要序列化在网络上传输的类实现Serializable接口就可以了 但对于这块知识点,随着工作年限的提升,我觉得必须要好好研究下它了,不能似懂非懂的只知道使用。…...
Python面向对象编程(OOP)深度解析:从封装到继承的多维度实践
引言 面向对象编程(Object-Oriented Programming, OOP)是Python开发中的核心范式,其三大特性——封装、继承、多态——为构建模块化、可维护的代码提供了坚实基础。本文将通过代码实例与理论结合的方式,系统解析Python OOP的实现机制与高级特性…...
传输层:UDP协议
1.UDP协议特点 2.UDP报文格式 如下: 校验和的计算: 3.例子 UDP(User Datagram Protocol,用户数据报协议)是一种无连接的传输层协议,其报文格式简单高效,适用于对实时性要求高但允许少量丢包的…...
使用WebStorm打断点调试Vue项目
1:打开WebStorm,先配置vue启动的服务,如下 2:如果上面的选择第4步空白,,就先启动过vue项目,或者在packege.json启动过,就可以直接添加npm服务 3:使用Debug启动项目 4&…...
AI助力:零基础开启编程之旅
一、代码调试 三步解决BUG 1. 错误信息翻译 指令模板: 错误诊断模式我遇到【编程语言】报错“粘贴报错信息“ 请: 用小白能懂的话解释问题本质标注可能引发该错误的三个场景给出最可能的修复方案和其他备选方案 2. 上下文分析 进阶指令 结合上下文代…...
信息学奥赛一本通 1535:【例 1】数列操作
【题目链接】 ybt 1535:【例 1】数列操作 【题目考点】 1. 树状数组 【解题思路】 本题为树状数组模板题,维护区间和,进行单点修改,区间查询。 详细讲解见:洛谷 P3374 【模板】树状数组 1(树状数组解法…...
MQTT协议详解:物联网通信的轻量级解决方案
MQTT协议详解:物联网通信的轻量级解决方案 引言 在物联网(IoT)快速发展的今天,设备间高效可靠的通信变得至关重要。MQTT(Message Queuing Telemetry Transport)作为一种轻量级的发布/订阅协议,已成为物联网通信的首选解决方案。本文将深入探…...
【时时三省】(C语言基础)使用字符串处理函数
山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 在C函数库中提供了一些用来专门处理字符串的函数,使用方便。几乎所有版本的C语言编译系统都提供这些函数。下面介绍几种常用的函数。 ①puts函数 输出字符串的函数 其一般形式…...
工具学习_VirusTotal使用
VirusTotal Intelligence 允许用户在其庞大的数据集中进行搜索,以查找符合特定条件的文件,例如哈希值、杀毒引擎检测结果、元数据信息、提交时的文件名、文件结构特征、文件大小等。可以说,它几乎是恶意软件领域的“谷歌搜索引擎”。 网页使…...
Linux下mysql的安装与远程链接
linux安装mysql 01下载依赖: 找到网址/download下: 最下面MySQL Community(mysql社区版) 选择MySQL Community Server 选择对应的mysql版本 操作系统版本选择 根据操作系统的版本选择具体版本号 下载离线版本 安装包详情 0…...
WebpackVite总结篇与进阶
模块化 Webpack Webpack 入口entry 分离app和第三方库入口 这是什么? 这是告诉 webpack 我们想要配置 2 个单独的入口点(例如上面的示例)。 为什么? 这样你就可以在 vendor.js 中存入未做修改的必要 library 或文件࿰…...
数据工具:数据同步工具、数据血缘工具全解析
目录 一、数据同步工具 (一)数据同步工具的定义与基本原理 (二)数据同步工具的类型 (三)数据同步工具的应用场景 二、数据血缘工具 (一)数据血缘工具的定义与作用 ࿰…...
贪吃蛇游戏排行榜模块开发总结:从数据到视觉的实现
一、项目背景与成果概览 在完成贪吃蛇游戏核心玩法后,本次开发重点聚焦于排行榜系统的实现。该系统具备以下核心特性: 🌐 双数据源支持:本地存储(localStorage)与远程API自由切换 🕒 时间维度统计:日榜/周榜/月榜/全时段数据筛选 🎮 模式区分:闯关模式(关卡进度…...
亚远景-基于ASPICE的汽车供应链质量管控培训
以下是一份基于ASPICE的汽车供应链质量管控培训的介绍: 培训目标 理解ASPICE核心概念:帮助学员全面掌握ASPICE的框架结构、最新版本的更新内容,深入理解过程评估模型和参考模型的实际应用。 提升开发过程成熟度:通过培训&#x…...
【工作记录】Kong Gateway 入门篇之部署及简单测试
Kong Gateway部署 Kong Gateway 可以通过多种方式部署,包括 Docker、Kubernetes、以及直接安装在操作系统上。以下是常见的部署方法: 使用 Docker 部署 安装 Docker 和 Docker Compose。创建一个 docker-compose.yml 文件,内容如下&#x…...
【Qt】之音视频编程1:QtAV的背景和安装篇
QtAV 背景与核心概念 1. 什么是 QtAV? QtAV 是一个基于 Qt 框架 和 FFmpeg 的多媒体播放库,旨在为 Qt 应用程序提供高性能、跨平台的音视频播放、处理及渲染功能。它封装了 FFmpeg 的底层编解码能力,并通过 Qt 的图形系统(如 QM…...
Centos7安装部署wordpress个人博客保姆级教程
目录 关闭防火墙修改yum镜像源安装 php安装mysql安装nginx关闭SELinux配置nginx转发php文件到fpm服务下载wordpress与配置 centos: 7 php:8.1.29 wordpress:6.8.1 nginx:1.26.1 mysql:5.6.51 关闭防火墙 # 停止防火墙 systemctl stop firewalld # 禁止开启启动 systemctl …...
Python-简单网络编程 I
目录 一、UDP 网络程序1. 通信结构图2. Python 代码实现1)服务器端2)客户端 3. 注意 二、TCP 网络程序1. 通信结构图2. Python 代码实现1)服务器端2)客户端 3. 注意 三、文件下载1. PyCharm 程序传参1)图形化界面传参2…...
深入浅出之STL源码分析8_三个指针
引言 在第一篇文章 深入浅出之STL源码分析1_vector基本操作-CSDN博客 中有引出了下面的几个问题 1.刚才我提到了我的编译器版本是g 11.4.0,而我们要讲解的是STL(标准模板库),那么二者之间的关系是什么?STL安装后我们…...
数据结构(七)——图
一、图的定义与基本术语 1.图的定义 图G由顶点集V和边集E组成,记为G(V,E),其中V(G)表示图G中顶点的有限非空集;E(G)表示图G中顶点之间的关系(边)的集合 注意:线性表可以是空表,树可以是空树&…...
养生:打造健康生活的全方位策略
在生活节奏不断加快的当下,养生已成为提升生活质量、维护身心平衡的重要方式。从饮食、运动到睡眠,再到心态调节,各个方面的养生之道共同构建起健康生活的坚实基础。以下为您详细介绍养生的关键要点,助您拥抱健康生活。 饮食养生…...
数据结构(2)线性表-顺序表
知道一个算法的好坏怎么去判断以后,就该正式的去学习一些常见的数据结构,当然,这里的数据结构仅仅是初阶,不会挨个一个一个学完,后期慢慢来。 一、数据结构总论 一般按照逻辑结构和存储结构来分类,在初阶…...
【深度学习-Day 10】机器学习基石:从零入门线性回归与逻辑回归
Langchain系列文章目录 01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…...
芯片:金线的作用
一、金线的核心作用:互联芯片与外部封装 金线(Gold Wire)在芯片制造中主要用于引线键合(Wire Bonding),这是将芯片(Die)与外部封装引脚(Lead Frame或Substrateÿ…...
Vue3+uniapp 封装axios
1.第一步在项目根目录新建utils文件夹,里边新建两个文件request.js和uni-api-promisify.js 2.request.js 代码 要安装axios import axios from axios import { showToast } from /utils/uni-api-promisify// 创建axios实例 const service axios.create({baseURL:…...
Nacos源码—9.Nacos升级gRPC分析七
大纲 10.gRPC客户端初始化分析 11.gRPC客户端的心跳机制(健康检查) 12.gRPC服务端如何处理客户端的建立连接请求 13.gRPC服务端如何映射各种请求与对应的Handler处理类 14.gRPC简单介绍 10.gRPC客户端初始化分析 (1)gRPC客户端代理初始化的源码 (2)gRPC客户端启动的源码…...
与智能体高效协作:Kimi交互逻辑探索与提示词设计实践【附kimi提示词合集下载】
引言:智能时代的人机协作新范式 在持续使用多款AI助手完成技术文档分析、数据分析等任务后,我逐渐意识到工具效能的核心不仅在于技术参数,更在于使用者对交互逻辑的理解深度。本文将基于实际项目经验,探讨智能体交互的本质规律&a…...
Web 架构之负载均衡会话保持
文章目录 一、引言二、思维导图三、负载均衡会话保持的概念3.1 定义3.2 作用 四、负载均衡会话保持的实现方式4.1 基于 IP 地址原理代码示例(以 Nginx 为例)注释 4.2 基于 Cookie原理代码示例(以 HAProxy 为例)注释 4.3 基于 SSL …...
遨游卫星电话与普通手机有什么区别?
在数字化浪潮席卷全球的今天,通信设备的角色早已超越传统语音工具,成为连接物理世界与数字世界的核心枢纽。然而,当普通手机在都市丛林中游刃有余时,面对偏远地区、危险作业场景的应急通信需求,其局限性便显露无遗。遨…...
【Redis】谈谈Redis的设计
Redis(Remote Dictionary Service)是一个高性能的内存键值数据库,其设计核心是速度、简单性和灵活性。以下从架构、数据结构、持久化、网络模型等方面解析 Redis 的设计实现原理: 1. 核心设计思想 内存优先:数据主要存…...
聊天项目总结
目前项目 完成了个人信息修改,添加好友,创建群聊,添加群聊,在线状态,删除好友,退出群,解散群,好友申请,群资料修改,群管理,群主转让,…...
智能手表整机装配作业指导书(SOP)
📄 智能手表整机装配作业指导书(SOP) 产品名称:Aurora Watch S1 产品型号:AWS1-BG22 版本号:SOP-AWS1-V1.0 编制日期:2025年5月6日 编制单位:制造工程部(ME)…...
c语言第一个小游戏:贪吃蛇小游戏05
贪吃蛇脱缰自动向右走:脱缰的野蛇 #include <curses.h> #include <stdlib.h> struct snake{ int hang; int lie; struct snake *next; }; struct snake *head; struct snake *tail; void initNcurse() { initscr(); keypad(stdscr,1); } int …...
ES6中的解构
在 JavaScript(包括 TypeScript)中,数组解构和对象解构是 ES6 引入的两个非常实用的语法特性,它们可以帮助我们更方便地从数组或对象中提取数据。 一、数组解构(Array Destructuring) 📌 基本用…...