浅谈AI Agent 演进之路
1、了解下 AI Agent 的定义
AI Agent(人工智能代理)简单来说是一种能够感知环境、进行决策和执行动作的智能实体。与传统的人工智能相比,AI Agent 具备独立思考和调用工具逐步完成目标的能力。
例如:当要求 AI Agent 帮助下单外卖时,它可以自主调用应用程序、选择餐品、提交订单并完成支付,而无需人为指定每一步操作。
AI Agent 的主要能力组成部分包括:
1、逻辑推理能力和行动能力(Planning)
1.1、子任务分解:将复杂的任务拆解为更小的、可管理的子目标,以便高效处理。
1.2、反思与完善:通过对历史行为的自我批评和反思,从错误中学习并优化后续操作,提升任务完成质量。
2、记忆能力和上下文理解(Memory)
2.1、短期记忆:用于上下文学习,帮助模型记住最近的对话或信息。
2.2、长期记忆:通过外部向量存储和检索,提供保留和召回长期信息的能力。
3、工具使用能力(Tools)
3.1、AI Agent 可以调用外部 API 获取额外信息,例如:实时数据计算、代码执行能力或专有信息源的访问权限。
针对上述三种能力,我们来具体看看过去几年 AI 生态圈是如何一步步发展的。
Step 1、 推理 Planning:让 AI 能“思考”和“行动”
首先 AI Agent 需要有很强的逻辑能力,因为最终在执行多步动作或是帮用户执行任务时,Agent 需要去整理清楚决策思路,如:应该使用哪些工具、有了工具之后如何取获取信息、得到信息之后应该去做哪些操作,所以推理能力是 Agent 最重要的能力之一。
2022年10月:ReAct 推理技术发布
就在 ChatGPT 上线前一个多月,2022年10月普林斯顿与 Google Brain 合作的团队提出了 ReAct 框架的论文[2],该框架是一个将推理行为与大语言模型 LLMs 相结合通用的范例。
ReAct(在语言模型中协同推理与行动)框架论文
ReAct 规范简单来说,就是让 AI 在回答问题的同时,能够去执行一些步骤,不仅仅只是“动动嘴皮子”。具体来讲的话,ReAct 做的事情其实更加偏向于提示词工程(Prompt Engineering),它想通过设定一些不同提示词,能够让大语言模型按照一定的格式去输出。比如:
第一步:观察现在的情况是怎么样的,理解用户的需求是什么
第二步:在观察的基础上再去思考一下你下一步要去做什么
第三步:确定下一步动作后,目前手上有1、2、3三种工具,自己决策为了帮用户解决问题,你会选择何种工具
第四步:确定工具后执行 function call 或 API 获取到相关信息
在2023年年初,AI Agent 技术的三大要素的第一步 Planning 就已经搭建好了,逻辑推理能力得到了显著的提升,也可以接各种外部的 API、调用外部工具来完成任务,那么接下来开发者生态进入到了技术发展的Step2。
Step 2 、记忆 Memory:让 Al 有更强的“记忆”能力
2023年5月11日:Claude 大模型支持 100K token(上下文窗口)
2023年6月13日:OpenAI 发布 Function Calling & GPT 大模型支持 16k token
2023年11月21日: Claude 2.1 大模型支持 200k 上下文
2024年的2月:Google 发布 Gemini 1.5 大模型支持百万级 token
2024年初,大模型支持的上下文窗口的 token 数扩展到了百万级别。至此,这个 AI Agent 发展必备的第二个技术壁垒 Memory 的限制也完全的被打破了,对于开发者来说就不是大问题了,直接进入Step 3。
Step3 工具 Tools:让 AI 开始“动手”
时间到了 2023 年年底,前两个技术壁垒的突破让 LLM 大语言模型充当虚拟世界的机器人这件事情变得更加可行,时机成熟时一些初创公司开始在硅谷生态圈活跃了起来。
2023年12月:Simular 发布AI Agent Demo
23年12月底时,一个叫 Simular AI[3] 的公司发布了他们的第一个 Agent 使用 demo,它应该是业界第一个在发布会上公布让大模型去控制人的电脑的 AI Agent 公司,这一点也算得上是技术的跃升。
2024月10月:Claude 大模型增加 Computer use功能
2024 年 10月 Claude 大模型发布了 Computer Use 功能,进一步支持 AI Agent 对控制的计算,让 AI 更像一个真正的可以行动起来的智能助手。可以看出,开发者社区或初创社区的行动都比大公司要早很多。
AI Agent 的四代技术与 AI OS
AI Agent 技术发展中的逻辑推理能力、上下文记忆能力和工具调用能力,在某种程度上来说,还属与Single Agent(单独智能体)的技术迭代过程。但是要让 AI Agent 真正发展起来,既要做到主流化规模化,就需要实现多个智能体Multi-Agent(多智能体)之间的通信互联。
当不同的 AI Agent 在不同的设备、不同的机房之间去做计算和联动,这才有机会能够推动上亿级别用户的应用。而这里就存在一个难点,需要一个通用的标准化协议适配范式。
让我们结合AI Agent 技术发展历史来具体看下 AI Agent 技术更新的定义:
【已实现】第一阶段:Single Agent(单独智能体)
AI Agent 拥有 Planning、Memory、Tools,中间有大模型 LLM 的驱动。
【已实现】 第二阶段:Multi-agent(单机)
Agent 中的 Planning 部分拥有逻辑推理和调度的能力,比如:要实现一个复杂任务,用户可以写很多 prompt,把复杂任务拆成很多个子任务,让各个 Agent 之间去通信,但此时的复杂仍是在一个单进程内完成的。像 LangGraph、CrewAI和微软推出的 AutoGen 都已实现多个 Agent 在一个单机上的库之间通信。
【探索中】 第三阶段:Agent实现不同设备、不同机房之间联动(MCP协议)
如果要支持上亿级别用户的应用,肯定需要一个能在不同设备、不同机房间数据联动和流通的架构,这就是我们目前依然处在尝试中的 Agent 第三阶段架构。这个阶段尝试解决的问题是:很多网站或者工具并不支持AI Agent 的调用(目前很多网站和服务都会有“反机器人/anti-bot”的设置)。
在 Manus 的测评案例中,我们也会发现 AI Agent 在执行任务时,也会经常访问不了很多数据来源而导致任务失败。所以在这个阶段中,我们需要去打造一个通用协议来解决这个问题,才能够去支持 AI Agent 与外界的联动。
目前很多公司包括 Antropic 在做协议适配上的尝试,2024年11月初,Antropic 推出了“模型上下文协议”(Model Context Protocol 简称MCP)协议,旨在统一大语言模型与外部数据源和工具之间的通信协议,MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题。
形象一点来说,Antropic 将 MCP 协议称之为“AI 应用的USB-C端口”,支持将大模型直接连到数据源。此前,企业和开发者要把不同数据接入 AI 系统,都得单独开发对接方案,而MCP做的就是提供一个「通用协议」来解决这个问题。
【探索中】 第四阶段:端云一体化的分布式 Agent 网络与互联协议
然而 MCP 解决了第三代技术的问题,还有最后一个的问题:目前 AI Agent 应用大规模爆发的壁垒,是真正统一的 Agent 和 Agent 间的协议通信标准与分布式计算,就像如今的安卓与iOS一样,我们也需要一个全球大家承认且通用的 AI OS。
谷歌在Google Cloud Next 25大会上,开源了首个标准智能体交互协议——Agent2Agent Protocol(简称A2A)
A2A 将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,A2A 协议当前有 50 多家著名企业参与共建。随着加入的企业越来越多,会极大提升A2A的商业价值以及推动整个智能体生态的快速发展。
不出意外,本次大会重点在 AI Agent 上,除了 A2A 之外,谷歌还效仿 OpenAI 开源了 Agent 开发套件 ADK,内部测试工具 Agent Engine。
A2A 是一种开放协议,为 Agent 提供了一种标准的交互方式,使它们能够相互协作,无论底层框架或供应商是什么。
例如,一家大型电商公司使用了多种企业平台和服务。Atlassian 用于团队项目管理,Box 用于文件存储和共享,Salesforce 用于客户关系管理,Workday 用于人力资源管理。
以前这些平台上的 Agent 无法自由通信。现在通过 A2A 协议,这些企业平台可以安全、自由地自动化交互数据。
A2A 设计原则
A2A 是一种开放协议,为代理之间的协作提供了一种标准方式,与底层框架或供应商无关。协议遵循以下几个核心原则:
- 拥抱 Agentic 能力。A2A 专注于使 agent 能够以自然、非结构化的方式进行协作,即使它们不共享内存、工具和上下文。我们正在实现真正的 multi-agent 场景,而不会将 agent 限制为 “工具”。谷歌正在启用真正的多 Agent 场景,而不是限制 Agent 成为一个工具。
- 建立在现有标准之上。该协议建立在现有的流行标准之上,包括 HTTP、SSE、JSON-RPC,这意味着它更容易与企业日常使用的现有 IT 栈集成。
- 默认安全。A2A 旨在支持企业级身份验证和授权,在发布时与 OpenAPI 的身份验证方案具有同等效力。
- 支持长时间运行的任务。我们设计了 A2A,使其具有灵活性,并支持从快速任务到深度研究的各种场景,当人类处于循环中时,这些场景可能需要数小时甚至数天才能完成。在整个过程中,A2A 可以向用户提供实时反馈、通知和状态更新。
- 模态无关。代理世界不仅限于文本,这就是为什么我们设计了 A2A 来支持各种模态,包括音频和视频流。
A2A 工作原理
A2A 的工作原理是通过促进客户端Agent和远程Agent之间的通信来实现的。客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作。在这个过程中,A2A协议有以下几个关键能力。
首先,Agent 可以通过“Agent卡”来宣传它们的能力。这些“Agent卡”是以JSON格式存在的,它们能够让客户端Agent识别出哪个远程Agent最适合执行特定的任务。
一旦确定了合适的远程Agent,客户端Agent就可以利用A2A协议与之进行通信,将任务分配给它。
然后,任务管理是A2A协议中的一个重要环节。客户端和远程Agent之间的通信都是围绕完成任务展开的。协议定义了一个“任务”对象,这个对象具有自己的生命周期。
对于一些简单的任务,可能可以立即完成;而对于一些复杂的、长期的任务,Agent们可以相互沟通,以保持对任务完成状态的同步。当任务完成时,其输出被称为“工件”。
此外,A2A还支持Agent之间的协作。Agent们可以相互发送消息,这些消息可以包含上下文信息、回复、工件或者用户指令。通过这种方式,Agent们能够更好地协同工作,共同完成复杂的任务。
最后,A2A还具备用户体验协商的功能。每条消息都包含“部分”,这些部分是完整的内容片段,例如,生成的图像。
每个部分都有指定的内容类型,这使得客户端和远程Agent能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等。这样,A2A就能够根据用户的需求和设备的能力,提供最佳的用户体验。
相关文章:
浅谈AI Agent 演进之路
1、了解下 AI Agent 的定义 AI Agent(人工智能代理)简单来说是一种能够感知环境、进行决策和执行动作的智能实体。与传统的人工智能相比,AI Agent 具备独立思考和调用工具逐步完成目标的能力。 例如:当要求 AI Agent 帮助下单外…...
佳博票据和标签打印:Web网页端与打印机通信 | iOS
文章目录 引言I Web网页端与打印机通信webSDK(包含示例页)打印测试II iOS与佳博打印机通信引言 佳博工具下载ESC是票据打印指令,TSC是标签打印指令 工业打印机:佳博GP-H430F工业机标签条码打印机物流快递电子面单条码机碳带机 应用场景:打印商品价格标签、打印交易小票 I…...
视频噪点多,如何去除画面噪点?
你是否遇到过这样的困扰?辛辛苦苦拍摄的视频,导出后却满屏 “雪花”,夜景变 “噪点盛宴”,低光环境秒变 “马赛克现场”? 无论是日常拍摄的vlog、珍贵的家庭录像,还是专业制作的影视作品,噪点问…...
微信小程序直传阿里云 OSS 实践指南(V4 签名 · 秒传支持 · 高性能封装)
文章目录 前言一、为什么要使用直传 OSS?二、整体架构与实现思路三、阿里云 OSS 配置(V4 签名)1. 权限设置2. 后端生成签名参数(返回给小程序) 四、微信小程序端上传流程(功能模块拆解与封装)第…...
云原生--核心组件-容器篇-1-Docker和云原生关系(Docker是云原生的基石)
1、基本概念 (1)、云原生(Cloud Native) 是一种构建和运行应用程序的方法论,旨在充分利用云计算环境(公有云、私有云、混合云)的特性,通过容器化、微服务、服务网格、声明式API等技…...
GAEA情感坐标背后的技术原理
基于GAEA的去中心化物理基础设施网络(DePIN),用户有机会在GAEA平台上获得宝贵的数据共享积分。为了提升这些洞察的丰富性,用户必须花费一定数量的积分,将过去的网络数据与当前的情感数据绑定,从而产生一种新…...
day01_编程语言介绍丶Java语言概述丶开发环境搭建丶常用DOS命令
编程语言介绍 编程语言是一种用于人与计算机之间通信的语言,允许程序员编写代码,这些代码告诉计算机要执行哪些操作。编程语言可以被视为计算机可以理解并执行的指令集合,它是一种标准化的交流技巧,用于向计算机发出指令。…...
STM32系列官方标准固件库的完整下载流程
一、官网导航与版本确认 访问ST官网 打开浏览器进入 ST官网,点击左侧 “工具与软件” 标签,展开后选择 “嵌入式软件” 。若页面未直接显示,可在搜索框输入“STM32 Standard Peripheral Libraries”查找。 → “STM32标准外设库”࿰…...
Android 14 系统统一修改app启动时图标大小和圆角
Android 14 统一修改app启动时图标大小和圆角 修改如下: 目录:frameworks/base/core/java/android/window/SplashScreenView.java frameworks/base/libs/WindowManager/Shell/src/com/android/wm/shell/startingsurface/SplashscreenContentDrawer.ja…...
MySQL 详解之函数:数据处理与计算的利器
在 MySQL 中,函数可以接受零个或多个输入参数,并返回一个值。这些函数可以在 SELECT 语句的字段列表、WHERE 子句、HAVING 子句、ORDER BY 子句以及 UPDATE 和 INSERT 语句中使用。合理利用函数,可以简化 SQL 语句,提高开发效率。 MySQL 提供了大量的内置函数 (Built-in F…...
Tailwind CSS 实战:基于 Kooboo 构建企业官网页面(一)
目录 一、技术选型:为什么选择Tailwind Kooboo? 二、CDN方案 vs 传统安装 三、CDN方式实战步骤 一、技术选型:为什么选择Tailwind Kooboo? 1.1 黄金组合优势 Tailwind CSS:原子化CSS框架,提供&#x…...
Java基础 — 条件结构与随机数
介绍 Java条件结构与随机数是程序逻辑控制的重要工具。条件结构通过if-else和switch实现分支判断:if(条件){代码}用于单分支,else if添加多条件判断,switch则基于固定值匹配不同case。随机数生成常用两种方式:Math.random()方法返…...
AI网络渗透kali应用(gptshell)
kali安装gptshell 一、shellGPT 工具介绍 ShellGPT是一款由AI大型语言模型(LLM)驱动的终端命令行工具。它能帮助用户直接在终端与AI交互,自动生成、解释、执行各类 Linux 命令,大大提升了运维和开发效率。ShellGPT 支持接入 O…...
如何实现Android屏幕和音频采集并启动RTSP服务?
技术背景 在移动直播和视频监控领域,实现高效的屏幕和音频采集并提供流媒体服务是关键技术之一。本文将详细介绍如何基于大牛直播SDK实现Android屏幕和麦克风/扬声器采集,并启动轻量级RTSP服务以对外提供拉流的RTSP URL。在Android平台上,轻…...
大模型提示词如何编写
一、提示词的核心三要素 明确目标(What) 告诉 AI「你要它做什么」,越具体越好。 ❌ 模糊:写一篇文章 ✅ 清晰:写一篇 800 字的高考作文,主题 “坚持与创新”,结构分引言、三个论点(…...
Serverless 在云原生后端的实践与演化:从函数到平台的革新
📝个人主页🌹:慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 一、引言:从服务器到“无服务器”的后端演变 在传统后端开发中,我们需要为服务配置并维护服务器资源,无论是物理机、虚拟机还是容器化服务,都需要: 管理系统运行环境 监控负载与扩缩容 保证高可用与安…...
反爬虫机制中的验证码识别:类型、技术难点与应对策略
在互联网数据抓取领域,验证码识别是爬虫过程中的关键环节之一。下面对常见验证码类型、技术难点及应对策略进行详细解析,并提供多种场景下的代码实现示例。 一、验证码类型与技术难点 (一)图形验证码 1. 字符验证码 特征&#…...
.NET 10 中的新增功能
.NET 运行时 .NET 10 运行时引入了新功能和性能改进。 关键更新包括: 数组接口方法反虚拟化:JIT 现在可以取消虚拟化和内联数组接口方法,从而提高数组枚举的性能。数组枚举去抽象化:改进功能以通过枚举器减少数组迭代的抽象开销…...
通过音频的pcm数据格式利用canvas绘制音频波形图
上面是一个完整的音频的波形图,可以大概知道音频整个的简略信息 数据准备:需要有这个音频的pcm数据,也就是时域采样值,每个数字代表某一时刻音频波形的振幅。 <!DOCTYPE html> <html lang"en"> <head&…...
Dubbo负载均衡策略深度解析
互联网大厂Java求职者面试:Dubbo负载均衡策略详解 第一轮提问: 面试官:马架构,您好!请问您了解Dubbo的负载均衡策略吗?Dubbo支持哪些负载均衡策略呢? 马架构:您好!Dub…...
【高频考点精讲】async/await原理剖析:Generator和Promise的完美结合
async/await原理剖析:Generator和Promise的完美结合 今天咱们聊聊async/await,这玩意儿用起来是真香,但你知道它背后是怎么运作的吗?其实它就是Generator和Promise的"爱情结晶"。 1. 先搞懂Generator Generator&…...
量子加密通信技术及其应用:构建无条件安全的通信网络
一、引言 在数字化时代,信息安全成为全球关注的焦点。随着量子计算技术的快速发展,传统的加密算法面临着前所未有的挑战。量子加密通信技术应运而生,它利用量子力学的基本原理,如量子叠加态和量子纠缠,实现了无条件安全…...
软考中级-软件设计师 知识点速过1(手写笔记)
第一章:数值及其转换 没什么可说的,包括二进制转八进制和十六进制 第二章:计算机内部数据表示 真值和机器数: 原码(后面都拿x 19举例) : 反码: 补码: 移码: 定点数&…...
【prompt是什么?有哪些技巧?】
Prompt(提示词)是什么? Prompt 是用户输入给AI模型(如ChatGPT、GPT-4等)的指令或问题,用于引导模型生成符合预期的回答。它的质量直接影响AI的输出效果。 Prompt 的核心技巧 1. 明确目标(Clar…...
C++进阶----多态
目录 引言1.多态的概念2.多态的定义及实现2.1 多态的构成条件2.2虚函数2.3 虚函数的重写2.4 关键字override和final2.5 重载、覆盖(重写)、隐藏对比 3.抽象类3.1 抽象类概念 4.多态的原理4.1 虚函数表4.2虚函数表的底层4.3多态的原理4.4 动态绑定和静态绑…...
银发科技:AI健康小屋如何破解老龄化困局
随着全球人口老龄化程度的不断加深,如何保障老年人的健康、提升他们的生活质量,成为了社会各界关注的焦点。 在这场应对老龄化挑战的战役中,智绅科技顺势而生,七彩喜智慧养老系统构筑居家养老安全网。 而AI健康小屋作为一项创新…...
【黑马 微服务面试篇】
分布式事务 cap定理-Availability CAP定理-Partition tolerance BASE理论 BASE理论是对CAP的一种解决思路,包含三个思想: BasicallyAvailable(基本可用):分布式系统在出现故障时,允许损失部分可用性&#…...
斗鱼娱乐电玩平台源码搭建实录
在本篇文章中,我们将以技术人的角度详细拆解一款风格接近850平台的斗鱼娱乐电玩系统源码,包含完整服务器端、前台补全资源和双端APP构建流程。基于七月最新更新内容,本教程将突出技术关键点、实战配置与代码示范,旨在为开发者和搭…...
缓存与数据库一致性深度解析与解决方案
缓存与数据库一致性深度解析与解决方案 一、一致性问题本质与挑战 1. 核心矛盾分析 缓存与数据库一致性问题源于数据存储的异步性与分布性,核心挑战包括: 读写顺序不确定性:并发场景下写操作顺序可能被打乱(如先写缓存后写数据…...
Flutter 弹窗队列管理:支持优先级的线程安全通用弹窗队列系统
在复杂的 Flutter 应用开发中,弹窗管理是一个常见难题。手动管理弹窗的显示顺序和条件判断不仅繁琐,还容易出错。为此,我们实现了一个支持优先级的线程安全通用弹窗队列管理系统。它能够自动管理弹窗的显示顺序,支持条件判断&…...
【Langchain】RAG 优化:提高语义完整性、向量相关性、召回率--从字符分割到语义分块 (SemanticChunker)
RAG 优化:提高语义完整性、向量相关性、召回率–从字符分割到语义分块 (SemanticChunker) 背景:提升 RAG 检索质量 在构建基于知识库的问答系统(RAG)时,如何有效地将原始文档分割成合适的文本块(Chunks&a…...
Linux 官方蓝牙协议栈 BlueZ 第一篇:入门与架构概览
Linux 官方蓝牙协议栈 BlueZ,包含内核驱动、用户态守护进程和 DBus 接口,支持 Classic Bluetooth 和 BLE。本篇将从协议栈演进、架构组件、安装调试、核心流程和开发入门五个角度,结合 PlantUML 图、C/Python 代码示例,帮助你全面掌握 BlueZ 基础。 目录 协议栈演进与概念 …...
多层级的对象如何修改、或json格式
场景: 对象有多层级,一层套一层,list套对象,对象套list。 现在需要修改期中一个list的内容,怎么弄呢? 注:每一层都new一个新list再set不可取,太麻烦,看起来乱而且还容易错。 最好…...
产品动态|千眼狼sCMOS科学相机捕获单分子荧光信号
单分子荧光成像技术,作为生物分子动态研究的关键工具,对捕捉微弱信号要求严苛。传统EMCCD相机因成本高昂,动态范围有限,满阱容量低等问题,制约单分子研究成果产出效率。 千眼狼精准把握科研需求与趋势,自研…...
VsCode如何使用默认程序打开word Excel pdf等文件
如何使用在VsCode使用默认程序打开文件? 1.在插件市场里搜open插件并安装 2.安装完后,右键文件打开,点击Open with default application,就可以了 是不是非常方便!!!...
【T-MRMSM】文本引导多层次交互多尺度空间记忆融合多模态情感分析
在特征提取的部分用了k-means abstract (背景) 近年来,随着多模态数据量的迅速增加,多模态情感分析(MSA)越来越受到关注.该方法通过整合不同数据模态间的信息,提高了情感极性提取的准确性,从而实现了信息的全面融合,提高了情感分析的精度。 (针对创新处的不足) …...
python pymysql如何保证数据库更新成功
python pymysql如何保证数据库更新成功 在使用Python的PyMySQL库与MySQL数据库交互时,确保数据库更新操作成功执行,可以通过以下几种方式: 使用execute()和commit() 当执行一个更新(UPDATE)、插入(INSERT)或删除(DELETE)操作时,你需要调用execute()方法来执行SQL语句…...
Redis是单线程的,如何提高多核CPU的利用率?
一句话回答: Redis 是单线程处理客户端命令,但可以通过 多实例部署、I/O 多路复用、后台线程 Redis 6 的 I/O Thread 支持,来充分利用多核 CPU。 一、Redis 单线程 ≠ 整个 Redis 都是单线程! Redis 主要的 网络事件 命令执行 …...
01.oracle SQL基础
SQL是结构化查询语言 SQL分类 数据定义语言(DDL --- create/alter/drop) sysdate --- 可以拿到当前系统时间 案例:创建学生表,教师表,课程表 -- 学生表 create table t_student(sid number(11) primary key,sname n…...
BEVPoolv2:A Cutting-edge Implementation of BEVDet Toward Deployment
背景 该论文是在BEVDet的基础上进行了一个调整优化,传统的方法是将特征图与深度预测进行外积得到视椎特征图,再将它与预处理好的体素索引结合,将每个视椎特征分类到每个voxel中进行累加和的操作。BEVFusion与BEVDepth等方法是避免了累加和&a…...
FreeRTOS学习笔记【10】-----任务上下文切换
1 概念性内容 开机到调度需要经历的步骤有: 系统初始化任务创建启动调度器上下文切换时间分片任务执行 1.1 任务本质 FreeRTOS 的 任务(Task)本质上就是一个运行在任务自己的栈区中无限循环的函数 一段上下文(context&#x…...
PDFMathTranslate:基于LLM的PDF文档翻译及双语对照的工具【使用教程】
1.简介 PDFMathTranslate 是一个用于科学 PDF 文档翻译及双语对照的工具,是一个功能强大且灵活的科学文档翻译工具,适合科研人员、学生和专业人士使用,能够有效提高文档翻译的效率和质量。其具有以下特点和功能: 核心功能 保留格…...
CSS 入门全解析
CSS 入门全解析:从选择器到布局的全面教学 一、CSS 是什么?二、CSS 的基本语法结构三、常见选择器讲解四、盒模型讲解(重点)五、字体与颜色样式六、布局方式6.1 浮动布局(了解)6.2 Flex 弹性布局࿰…...
用户案例--慧眼科技
作者:算力魔方创始人/英特尔创新大使刘力 每个行业都有其独特的需求,算力魔方推出了全面的定制化服务,从概念到产品化,满足各行各业,用户可以根据具体应用需求定制更多接口或更强图形处理的需求,且算力魔方…...
面试中被问到mybatis与jdbc有什么区别怎么办
1. 核心区别 维度JDBCMyBatis抽象层级底层API,直接操作数据库高层持久层框架,封装JDBC细节代码量需要手动编写大量样板代码(连接、异常处理等)通过配置和映射减少冗余代码SQL管理SQL嵌入Java代码,维护困难SQL与Java代…...
科技与商业动态简报
睿创咨询 聚焦与深耕IPD领域长达20年,联合多名企业经营实战专家和前高管,睿创咨询借力IPD,为企业全方面提高产品竞争力,让增长从偶然变为必然!...
Flutter Dart中的类 对象
Dart 基本特征 私有属性/私有方法 import test88.dart;main() {var home new MainHome();home.execRun(); //间接的调用私有方法 }class MainHome {String _name "张三";//私有属性int age 10;main() {_run();print(_name);}void _run() {print("私有方法&qu…...
4G卡的DTU固件TCP通讯
4G卡DTU固件的TCP通讯 概述TCP通讯测试软硬件准备上网步骤 总结 概述 银尔达的DTU固件的4G卡可以应用到很多领域。我用的是YED-M780-B. 主要特点: 1、5~12V供电 2、工作环境为-35℃-75℃; 3、 支持1路TTL 串口,兼容3.3V电平和5V电平&#x…...
Spring Boot 读取配置文件的几种方式
Spring Boot 提供了灵活多样的方式来读取配置文件(如 application.yml 或 application.properties),本文介绍几种常见的读取方式。 1. 配置文件位置与加载顺序 Spring Boot 默认从以下位置加载配置文件(优先级从高到低࿰…...
Winform(1.Winform控件学习)
使用的控件有:Button,Label,TextBox button:表示一个按钮,用户点击按钮触发事件 click事件最常用 label:标签,用于显示文本 Name属性:变量名称 textBox:输入框 Form1代码: using System; using System.Collections.Generic; using Sy…...