AI Agent Protocols:现状、挑战与未来展望
一、引言
在当今人工智能飞速发展的时代,大语言模型(LLMs)的进步使得LLM智能体在各个行业得到了广泛的应用,如客户服务、内容生成、数据分析和医疗保健等领域。
然而,随着越来越多的LLM智能体被部署,一个关键问题逐渐浮现:目前缺乏一种标准的方式让这些智能体与外部工具或数据源进行通信。这种标准化协议的缺失,不仅使得智能体之间难以协同工作和有效扩展,还限制了它们处理复杂现实任务的能力。
正如早期互联网因系统不兼容和连接受限而碎片化,后来TCP/IP和HTTP协议的出现带来了全球连接、创新和价值创造的新时代。同样,为LLM智能体建立统一的通信协议,将能够让智能体和工具更顺畅地交互,促进协作,并推动集体智能的形成。
二、AI Agent Protocols的现状
(一)现有协议分类
在《A Survey of AI Agent Protocols》这篇论文中,对现有的智能体协议进行了系统的分类,将其分为四大主要类别。具体来说,有面向上下文的协议和智能体间协议,而这两类协议又各自包含通用目的协议和特定领域协议。
面向上下文的通用目的协议旨在为智能体与外部资源进行上下文获取提供通用的标准和方法,使得智能体能够更高效地从各种数据源中获取所需信息。例如,Anthropic推出的模型上下文协议(MCP),它标准化了LLM智能体与外部资源之间的上下文获取过程,大大增强了智能体与外部数据和工具的通信能力,就像给智能体配备了一个"外部大脑",使其能够更有效地处理复杂的现实问题。
特定领域的面向上下文协议则是针对特定行业或领域的需求而设计的。比如在电商行业,可能会有专门的协议来规范智能体与电商平台的数据交互,以实现商品搜索、交易处理等功能。
智能体间的通用目的协议致力于促进不同供应商和结构的智能体之间的协作。例如Google的Agent - to - Agent(A2A)协议,它使得在多智能体场景中,来自不同背景的智能体能够像团队一样协同工作,共同完成任务。
特定领域的智能体间协议则是为特定领域内的智能体协作提供支持。例如在医疗领域,不同的医疗智能体可能需要通过特定的协议进行协作,以实现病例分析、诊断建议等功能。
(二)性能分析
对这些协议在安全、可扩展性和延迟等关键维度上进行了比较分析。安全性能是智能体协议的重要考量因素之一,因为智能体在与外部工具和数据源交互时,可能会涉及到敏感信息的传输和处理。一个安全性能良好的协议能够确保数据的保密性、完整性和可用性,防止信息泄露和恶意攻击。
可扩展性方面,随着智能体应用场景的不断扩大和智能体数量的增加,协议需要能够支持系统的扩展,而不会出现性能下降或功能受限的情况。例如,在一个大型企业中,可能会有大量的智能体协同工作,协议需要能够有效地管理这些智能体之间的通信和协作。
延迟也是一个关键指标,特别是在实时性要求较高的应用场景中,如金融交易、自动驾驶等。低延迟的协议能够确保智能体及时获取所需信息并做出响应,从而提高系统的效率和性能。
(三)应用案例
从实时搜索信息中可以了解到,AI Agent在各个行业都有广泛的应用案例。在信息收集领域,传统搜索引擎依赖关键词匹配,往往返回大量繁杂且相关性不强的结果,用户需耗费大量时间甄别筛选。而AI Agent则截然不同,它仿若一位专业且贴心的信息管家,能依据用户设定的主题、领域、时间范围等多维需求,运用智能算法遍历各类数据库、网站、社交媒体平台等信息源,精准抓取高匹配度信息。在金融领域,投资分析师借助AI Agent可实时追踪全球股市动态、公司财报、行业新闻等,不错过任何关键投资信号。
在数据分析领域,如数势科技的swiftAgent,将传统的BI手动全流程产品(GUI)通过大模型进行基于语言的(LUI)模式重构,包括交互的指标问询、智能的洞察归因、分析报告自动生成、指标的全生命周期管理等能力。网易数帆在面对大模型出错的情况时,通过自研NL2SQL专属大模型,针对相关数据相关函数如同比/环比/分组排序等函数进行增强,保障需求可理解;通过交互界面上以自然语言的方式生成查询的解释,让用户容易去识别模型生成过程的对错,保障过程可验证;基于查询解释,用户可手动在查询结果的查询条件上进行调整查询条件,用确定性的手段获取正确性的结果,实现用户可干预;通过实时针对结果,进行正误标记反馈持续优化大模型的生成正确性,实现结果可运营。
三、AI Agent Protocols面临的挑战
(一)标准化难题
目前智能体协议缺乏统一的标准,不同的供应商和开发者可能采用不同的协议和接口,这使得智能体之间的互操作性受到限制。例如,不同的智能体可能使用不同的格式和规则来与外部工具进行通信,导致它们难以协同工作。这种标准化的缺失不仅增加了开发和集成的难度,还限制了智能体系统的扩展性和灵活性。
(二)安全风险
随着AI Agent的广泛应用,安全问题日益凸显。传统AI模型和应用的安全风险通常限于模型输入、模型处理和模型输出、编排层的软件漏洞以及托管它们的环境。除了这些威胁外,AI Agent还引入了新的人工智能风险。
在使用AI Agent时,安全风险范围扩大到了AI Agent触发和参与的一系列事件和交互中,这些通常对人类或系统操作员来说是不可见的,也无法进行阻止。例如,智能体可能会在与外部数据源交互时泄露敏感信息,或者被恶意攻击利用来执行非法操作。
(三)性能挑战
将在开发环境中运行良好的AI Agent部署到高流量的生产环境,会遇到一系列新的工程和运维难题。工具超时、API调用失败、错误的响应格式、模型服务和推理的资源瓶颈等问题,在请求量增大时,都可能导致系统性能急剧下降。例如,在一些电商促销活动期间,大量用户同时访问智能客服系统,可能会导致系统响应缓慢甚至崩溃。
(四)决策可靠性
AI Agent的核心挑战之一在于保证决策的稳定性和可靠性。它们不像传统软件那样遵循明确的规则,而是需要解读用户意图、进行复杂推理,并基于概率做出判断。这种不确定性,使得预测和控制智能体在不同情境下的反应变得困难,尤其是在需要精准决策的商业场景中。例如,在金融投资决策中,智能体的错误决策可能会导致巨大的经济损失。
四、未来展望
(一)短期展望
从静态到可演化。未来的协议需要具备更强的适应性,能够在快速变化的环境中生存和发展。例如,随着技术的不断进步和应用场景的不断变化,协议需要能够自动调整和优化,以适应新的需求和挑战。智能体可能需要根据不同的任务和环境,动态地选择合适的协议和策略。
(二)中期展望
从规则到生态系统。未来的协议将不仅仅是简单的规则和标准,而是会形成一个完整的生态系统。在这个生态系统中,不同的智能体、工具和数据源能够相互协作、相互促进,形成一种集体智能。例如,各个行业的智能体可以通过统一的协议进行交互和合作,共同推动行业的发展。
(三)长期展望
从协议到智能基础设施。下一代的协议将成为智能基础设施的重要组成部分,支持更高级的智能体生态系统。这些协议将具备隐私保护、基于群体的交互等特性,为智能体的发展提供更坚实的基础。例如,在未来的智能城市中,各种智能设备和系统可以通过统一的协议进行通信和协作,实现城市的智能化管理和运营。
五、结语
AI Agent Protocols的发展对于推动人工智能的应用和发展具有重要意义。虽然目前面临着标准化、安全、性能和决策可靠性等诸多挑战,但随着研究的不断深入和技术的不断进步,相信未来会出现更加完善和强大的协议。
这些协议将为智能体的发展提供更好的支持,促进智能体在各个行业的广泛应用,推动人工智能技术迈向一个新的台阶。作为开发者和研究者,我们应该积极关注和参与AI Agent Protocols的研究和实践,为构建更加智能、高效的未来社会贡献自己的力量。
相关文章:
AI Agent Protocols:现状、挑战与未来展望
一、引言 在当今人工智能飞速发展的时代,大语言模型(LLMs)的进步使得LLM智能体在各个行业得到了广泛的应用,如客户服务、内容生成、数据分析和医疗保健等领域。 然而,随着越来越多的LLM智能体被部署,一个…...
自动化立库/AGV物流仿真详细步骤
以下是一种可以在预算和周期内实现自动化立库及AGV 方案仿真分析的方法: 一、工具选择 软件工具FlexSim:这是一款流行的离散事件仿真软件。它具有直观的图形用户界面,通过简单的拖拽操作就可以构建自动化立库和 AGV 的模型。其内置的丰富的…...
【题解-Acwing】872. 最大公约数
题目:872. 最大公约数 题目描述 给定 n 对正整数 ai,bi,请你求出每对数的最大公约数。 输入 第一行包含整数 n。 接下来 n 行,每行包含一个整数对 ai,bi。 输出 输出共 n 行,每行输出一个整数对的最大公约数。 数据范围 1 ≤ n ≤ 105, 1 ≤ai, bi ≤ 2109 时空限…...
62.微服务保姆教程 (五) Seata--微服务分布式事务组件
Seata–微服务分布式事务组件 一、什么是分布式事务 1.什么是事务 事务指的是一个操作单元,在这个操作单元中的所有操作最终要保持一致的行为,要么所有操作都成功,要么所有的操作都被撤销。 2.本地事务 本地事务是指基于关系型数据库的事务,也称为传统事务。大多数场景…...
【算法练习】归并排序和归并分治
文章目录 1.归并排序1.1 递归版本1.2 非递归版本 2.归并分治2.1 计算数组的小和2.2 计算翻转对 1.归并排序 归并排序的核心步骤是: 拆分:将无序数组不断对半拆分成小块,直到每个小块只剩一个元素(自然有序)。 合并&a…...
从SOA到微服务:架构演进之路与实践示例
一、架构演进背景 在软件开发领域,架构风格随着业务需求和技术发展不断演进。从早期的单体架构,到面向服务架构(SOA),再到如今的微服务架构,每一次变革都是为了解决当时面临的核心问题。 二、SOA架构解析 2.1 SOA核心概念 SOA&…...
vue+cesium线流动纹理
index.vue页面 <!--线流动纹理实现--> <template><div id"mapContainerFirst"></div> </template> <script lang"ts" setup> import { init as initPolylineTrailLinkMaterialProperty } from ./PolylineTrailLinkM…...
深度学习·经典模型·SwinTransformer
SwinTransformer 主要创新点:移动窗口,基于窗口的注意力计算 Patch Embedding 下采样打包为Pacth:可以直接使用Conv2d 也可以先打包后使用embedding映射。 Patch Merging 类似池化的操作,压缩图片大小,同时通道数增多ÿ…...
在开发板上如何处理curl: (60) SSL certificate problem
目录 引言 问题解析 解决方法 跳过证书验证 采用证书认证 结语 引言 最近一直推荐学生们在课程实验中使用curl及其libcurl。curl 是一个强大的命令行工具,用于在命令行中进行数据传输。它支持多种协议,如 HTTP、HTTPS、FTP、FTPS、SCP、SFTP 等。…...
Ansible 铸就 Linux 安全之盾(Ansible Builds Linux Security Shield)
Ansible 铸就 Linux 安全之盾:自动化基线检查与防护 在当今网络安全形势日益严峻的背景下,Linux 系统作为服务器和关键基础设施的核心,其安全防护显得尤为重要。Ansible 作为一款强大的自动化运维工具,能够帮助我们高效、可靠地实…...
字符串(格式化字符串字面值)进行输出
在 Python 中,print(fnew_obs:{new_obs}) 这种形式是使用 f 字符串(格式化字符串字面值) 进行输出,它可以打印 任何可转换为字符串的数据类型,并且支持在字符串中嵌入表达式。以下是详细说明: 1. 基本功能…...
微服务架构详解:从概念到实践
目录 前言1. 微服务架构概述1.1 什么是微服务?1.2 微服务的核心思想 2. 微服务的优势2.1 可扩展性2.2 高灵活性2.3 容错性和可靠性2.4 高效开发与部署 3. 微服务的挑战3.1 系统复杂性增加3.2 分布式事务和数据一致性3.3 部署和运维的复杂性 4. 微服务的实施与实践4.…...
激光驱鸟:以科技重构生态防护边界
技术原理 激光驱鸟装置的核心机制基于鸟类视觉系统特性。其发射的绿色激光束(波长通常为532纳米)处于鸟类视网膜敏感光谱范围内,当激光束在特定角度扫描时,会形成动态光斑干扰。鸟类视网膜中视锥细胞对绿色光的高敏感度使其产生应…...
【Python魔法方法(特殊方法)】
在 Python 中,许多运算符都可以进行重载,以下是一些常见运算符及其对应的魔法方法(特殊方法): 算术运算符 加法 :__add__ 用于定义对象相加的行为。例如,当你对两个自定义类的实例使用 运算符…...
centos上安装python的3.13版本
在 CentOS 上安装 Python 3.13(或其它自定义版本)最推荐的方法是通过源码编译安装,不会影响系统自带的 Python2/Python3 环境,也更灵活可控。 以下步骤适用于: ✅ CentOS 7 / 8 / 9 ✅ 安装 Python 3.13(…...
实习技能记录【4】-----消息分发中的观察者模型
观察者 观察者模式(Observer Pattern)是一种行为型设计模式,主要用于定义对象之间的一对多依赖关系,让多个观察者对象能够同时监听某个主题对象的状态变化,并在主题对象状态改变时自动通知所有观察者对象。 参考b站博…...
Linux 下编译BusyBox
一、linux下编译 1.拉取busybox源码 git clone https://github.com/mirror/busybox.git 内容如下 2.配置make,建议在linux下单独开一个终端执行 进入busybox源码目录,使用如下命令 make menuconfig 3.报错 解决办法: 安装ncurses sud…...
Linux《进程概念(中)》
在之前的Linux《进程概念(上)》当中我们已经了解了进程的基本概念以及如何去创建对应的子进程,那么接下来在本篇当中我们就继续来进程的学习,在本篇当中我们要学习到进程的状态、进程的优先级、进程切换、Linux真实的调度算法——…...
Linux Vim 使用 显示行号、替换、查找、多文件打开等骚操作
目录 简述 vim的三种模式 概述 转换方式 文本编辑 命令模式 插入(编辑)模式 底行模式 搜索关键字 显示行号 替换 多文件打开 简述 vi编辑器是Linux系统下标准的编辑器。 那么简单的理解,就像是Windows下的记事本。 补充&a…...
AimRT 从零到一:官方示例精讲 —— 三、Executor示例.md
Executor示例 官方仓库:executor 配置文件(configuration_executor.yaml) 依据官方示例项目结构自行编写YAML配置文件: # 基础信息 base_info:project_name: Logger # 项目名称build_mode_tags: ["EXAMPLE", &quo…...
只把夜莺监控当作告警来使用:一种轻量化的运维实践
只把夜莺监控当作告警来使用:一种轻量化的运维实践 在现代的 IT 运维体系中,监控和告警是两个经常被一同提及的概念。然而,在实际工作中,很多团队对监控系统的需求并不一定全面覆盖指标采集、可视化展示、告警触发等功能…...
按键精灵安卓ios辅助工具脚本:实用的文件插件(lua开源)
亮点:此lua插件可再android和ios上通用 1、获取文件的属性 2、改变当前的工作路径为dirpath 3、获取当前的工作路径 4、创建文件夹,支持多级创建 5、删除文件夹 6、递归遍历文件夹 7、设置文件的访问时间和修改时间 函数原型:lfs.Attribute(…...
水库现代化建设指南-水库运管矩阵管理系统建设方案
政策背景 2023年8月24日,水利部发布的水利部关于加快构建现代化水库运行管理矩阵的指导意见中指出,在全面推进水库工程标准化管理的基础上,强化数字赋能,加快构建以推进全覆盖、全要素、全天候、全周期“四全”管理,完…...
若依后台管理系统-v3.8.8-登录模块--个人笔记
各位编程爱好者们,你们好!今天让我们来聊聊若依系统在登录模块的一些业务逻辑,以及本人的一些简介和心得,那么废话不多说,让我们现在开始吧。 以下展示的这段代码,正是若依在业务层对应的登录代码…...
Flip PDF Plus Corp7.7.22电子书制作软件
flip pdf plus corporate7.7.22中文版由FlipBuilder官方出品的一款企业级的翻页电子书制作软件,拥有丰富的模板,主题和动画场景,每本书最大页数1000页,每本书的最大大小1GB,即可以帮助企业用户制作好丰富的电子书籍。 …...
公路安全知识竞赛主持稿串词
合 :尊敬的各位领导、各位来宾 、各位选手 : 大家上午 好! 男 :安全就是生命,安全就是效益,安全是一切工作的重中之重!安全生产只有满分,没有及格。只有安全生产这个环节不出差错,我…...
vscode 配置qt
工具:vscode、qttools、qtconfigure Search Mode改成基于cmake的。 # 在项目中指定Qt的路径 set(Qt5_DIR "/home/jp/qt-everywhere-src-5.12.9/arm-qt/lib/cmake/Qt5") # 用于指定 Qt5 的安装路径 find_package(Qt5 REQUIRED COMPONENTS Widgets)这样就…...
Node.js 事件循环和线程池任务完整指南
在 Node.js 的运行体系中,事件循环和线程池是保障其高效异步处理能力的核心组件。事件循环负责调度各类异步任务的执行顺序,而线程池则承担着处理 CPU 密集型及部分特定 I/O 任务的工作。接下来,我们将结合图示,详细剖析两者的工作…...
Java之BigDecimal
BigDecimal 是 Java 中用于高精度计算的类,特别适合需要精确十进制运算的场景,如金融计算、货币运算、概率计算等。 为什么需要 BigDecimal类 解决浮点数精度问题:float 和 double 使用二进制浮点运算,无法精确表示某些十进制小数…...
Qt5与现代OpenGL学习(四)X轴方向旋转60度
把上面两张图像放到D盘1文件夹内: shader.h #ifndef SHADER_H #define SHADER_H#include <QDebug> #include <QOpenGLShader> #include <QOpenGLShaderProgram> #include <QString>class Shader { public:Shader(const QString& verte…...
基于LVS+Keepalived+NFS的高可用负载均衡集群部署
目录 项目功能 2 项目的部署 2.1 部署环境介绍 2.2 项目的拓扑结构 2.3 项目环境调试 2.4 项目的部署 2.4.1 安装软件; 2.4.2 NFS服务器配置 2.4.3 Web节点配置 2.5 项目功能的验证 2.6 项目对应服务使用的日志 项目功能 负载均衡功能 实现原理:基于LVS(D…...
人工智能数学基础(四):线性代数
线性代数是人工智能领域的核心数学工具之一,广泛应用于数据表示、模型训练和算法优化等多个环节。本文将系统梳理线性代数的关键知识点,并结合 Python 实例,助力读者轻松掌握这一重要学科。资源绑定附上完整资源供读者参考学习! …...
基于C++的IOT网关和平台1:github项目ctGateway
初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的,可以在任何平台上使用。 源码指引:github源…...
LeetCode 2962.统计最大元素出现至少 K 次的子数组:滑动窗口
【LetMeFly】2962.统计最大元素出现至少 K 次的子数组:滑动窗口 力扣题目链接:https://leetcode.cn/problems/count-subarrays-where-max-element-appears-at-least-k-times/ 给你一个整数数组 nums 和一个 正整数 k 。 请你统计有多少满足 「 nums 中…...
Nginx反向代理的负载均衡配置
Nginx 负载均衡详解 在互联网应用中,随着网站访问量的不断攀升,服务器的服务模式也需要进行相应升级。诸如分离数据库服务器、将图片作为单独服务等操作,这些都属于简单的数据负载均衡,其目的是将压力分散到不同机器上。而来自 We…...
案例速成GO+Socket,个人笔记
更多个人笔记:(仅供参考,非盈利) gitee: https://gitee.com/harryhack/it_note github: https://github.com/ZHLOVEYY/IT_note 文章目录 简单知识了解实现一个TCP 服务器与客户端(聊天室&#x…...
篮球足球体育球员综合资讯网站模板
采用帝国CMS7.5新版核心。栏目和内容模板超多变换。后台操作简单,安全可靠,性能稳定。整站浏览效果高端大气,可以帮助你快速建立一个适合自己的软件下载类型的站点! 演示地址:https://www.tmuban.com/store/620.html …...
HTTP(超文本传输协议)全面总结
HTTP(HyperText Transfer Protocol,超文本传输协议)是万维网(World Wide Web)应用中的基础协议,用于客户端与服务器之间的数据传输。随着互联网技术的发展,HTTP协议也经历了多个版本的更新&…...
OpenCV 图形API(72)图像与通道拼接函数-----根据指定的方式翻转图像(GMat)函数 flip()
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 翻转一个2D矩阵,围绕垂直轴、水平轴或同时围绕两个轴。 该函数以三种不同的方式之一翻转矩阵(行和列的索引是从0开始的&a…...
【报错问题】 macOS 的安全策略(Gatekeeper)阻止了未签名的原生模块(bcrypt_lib.node)加载
这个错误是由于 macOS 的安全策略(Gatekeeper)阻止了未签名的原生模块(bcrypt_lib.node)加载 导致的。以下是具体解决方案: 1. 临时允许加载未签名模块(推荐先尝试) 在终端运行以下命令&#x…...
keep-alive具体使用方法
什么是 Keep-Alive <keep-alive> 是 Vue.js 提供的一个内置组件,用于缓存动态组件实例,从而避免重复渲染已加载过的组件。它的主要功能是在切换组件时保留状态和 DOM 结构,提升性能。 工作原理 <keep-alive> 的核心在于维护一个…...
【C++11】包装器:function与bind
前言: 上文我们学了C11中一个新的表达式:Lambda表达式。Lambda表达式可以在函数内部定义,其本质是仿函数【C11】Lambda表达式-CSDN博客 本文我们来学习C11的下一个新语法:包装器 function function的定义为: templat…...
Educational Codeforces Round 178 div2(题解ABCDE)
A. Three Decks #1.由于最后三个数会相等,提前算出来和,%3判断,再判前两个数是否大于 #include<iostream> #include<vector> #include<stdio.h> #include<map> #include<string> #include<algorithm> #…...
mermaid 序列图 解析
sequenceDiagramparticipant UI as 用户界面participant Executor as 任务执行器participant StateMgr as 状态管理器participant Repo as 数据仓库UI->>Executor: 执行任务3350c74e...Executor->>StateMgr: 更新状态为"measuring"StateMgr->>Repo…...
DTO,VO,PO,Entity
1. DTO (Data Transfer Object) 定义 DTO 是数据传输对象,用于在不同系统或层之间传输数据。 目的 简化数据传输,降低耦合,通常只包含需要传输的字段,避免暴露内部实现细节。 使用场景 Controller 和 Service 或 远程调用 之…...
Proser:重新介绍
回想Proser的定位:一款直观的【协议发送】模拟软件。 现在间断更新下来,基本成了一款通信调试助手类软件 Proser 是一款支持串口与网络的通信调试助手,其独有的协议编辑器、数据检视、标尺等功能,让指令模拟与数据分析更加易用。…...
微信小程序 首页之轮播图和搜索框 代码分享
注意!!! 只有样式,还没功能开发!!! index.wxml <!-- 搜索框 --> <view class"search"><input placeholder"请输入搜索的内容"></input><imag…...
3D可视化编辑器模版
体验地址:http://mute.turntip.cn 整个搭建平台核心模块包含如下几个部分: 3D场景渲染 组件拖拽系统 元素编辑功能 状态管理 历史记录与撤销/重做 技术栈 前端框架与库 React 18 用于构建用户界面的JavaScript库 Next.js 14 React框架,提供服…...
foc控制 - clarke变换和park变换
1. foc控制框图 下图是foc控制框图,本文主要是讲解foc控制中的larke变换和park变换clarke变换将 静止的 a b c abc abc坐标系 变换到 静止的 α β αβ αβ坐标系,本质上还是以 定子 为基准的坐标系park变换 则将 α β αβ αβ坐标系 变换到 随 转…...
DeepSeek: 探索未来的深度学习搜索引擎
深度学习驱动的下一代搜索引擎:DeepSeek 在信息爆炸的时代,搜索引擎作为连接用户与互联网世界的桥梁,其重要性不言而喻。然而,随着用户需求的日益多样化和复杂化,传统搜索引擎在理解和满足用户需求方面逐渐显现出局限…...