百度Create大会深度解读:AI Agent与多模态模型如何重塑未来?
目录
百度Create大会亮点全解析:从数字人到Agent生态布局
数字人商业化:从"拟人"到"高说服力"的进化
Agent生态:从"心响"App看百度的Agent战略布局
"心响"App的技术架构与创新点
多模态大模型:文心4.5 Turbo与X1 Turbo的技术突破
多模态能力:从理解到生成的全面进化
生态建设:MCP协议支持与沧舟OS的技术布局
MCP协议:AI世界的"万能插座"
沧舟OS:多模型协同的技术底座
总结与展望:百度AI战略的三大关键点
百度Create大会亮点全解析:从数字人到Agent生态布局
2025年4月25日,百度Create大会如期举行,百度集团创始人李彦宏携多项AI创新成果亮相。本次大会聚焦三大核心领域:数字人商业化应用、Agent生态建设以及多模态大模型技术突破。作为国内AI领域的重量级玩家,百度此次发布的产品矩阵不仅展示了其技术实力,更揭示了AI产业未来的发展方向。
数字人商业化:从"拟人"到"高说服力"的进化
百度在电商领域的布局正通过数字人技术实现差异化竞争。最新发布的"高说服力数字人"突破了传统数字主播的局限,具备环境感知和智能决策能力。这种数字人能够根据直播间实时数据(如观众数量、互动内容)自主做出发红包、换品等运营决策,其背后是多智能体协同工作的结果。
表:高说服力数字人与传统数字人对比
功能特性 | 传统数字人 | 高说服力数字人 |
---|---|---|
互动能力 | 预设脚本循环播放 | 实时环境感知与响应 |
决策机制 | 无自主决策 | 多智能体协同决策 |
运营支持 | 单一主播角色 | 主播+运营+场控专家系统 |
成本效益 | 中等 | 较高(但ROI更优) |
应用场景 | 基础直播 | 复杂电商运营场景 |
百度副总裁平晓黎强调:"我们不做货架电商的重复建设,而是通过智能工具赋能整个电商生态。"这种"卖水人"策略既避免了与巨头的正面竞争,又能在AI赋能电商的浪潮中占据有利位置。
Agent生态:从"心响"App看百度的Agent战略布局
Agent技术无疑是2025年最受关注的AI应用方向。百度推出的"心响"App可视为对Manus的回应,但其技术实现路径却独具特色。
"心响"App的技术架构与创新点
"心响"基于百度自研的Agent Use协议,采用主智能体+专业智能体的架构设计。与Manus侧重工具调用不同,"心响"强调智能体间的协同调度。当用户提出需求时,主智能体会分析任务类型,并自动调用最适合的专业智能体(目前已支持200+任务类型)来完成任务。
表:主流Agent产品对比分析
产品特性 | Manus | 心响App | 行业平均水平 |
---|---|---|---|
任务可视化 | ✔️ | ✔️ | 部分支持 |
智能体调度 | 工具优先 | 智能体优先 | 混合模式 |
执行透明度 | 高 | 极高 | 中等 |
任务类型 | 150+ | 200+ | 50-100 |
响应速度 | 快 | 中等(强调质量) | 快但质量不稳定 |
百度智能体业务首席架构师黄际洲透露:"我们计划将支持的任务类型扩展到10万+,PC端版本也在开发中。"这种快速迭代的能力背后是百度在搜索生态积累的海量场景数据。
产品经理黎宇昕特别指出,百度正从"即时交付"转向"托管心智"的用户教育。这意味着用户需要接受AI完成任务可能需要更长时间,但质量更有保障。这种心智转变对AI产品的长期发展至关重要。
多模态大模型:文心4.5 Turbo与X1 Turbo的技术突破
面对DeepSeek等竞争对手,百度在模型层面选择了差异化竞争策略。新发布的文心4.5 Turbo和X1 Turbo在多模态理解和成本控制方面表现突出。
多模态能力:从理解到生成的全面进化
李彦宏在大会上强调:"纯文本模型的市场会越来越小,多模态才是未来。"文心新模型在图像、视频理解方面展示了强大能力,如通过模糊图像识别历史事件,基于文本描述生成创意图像等。
表:主流大模型多模态能力对比
模型能力 | DeepSeek V3 | 文心4.5 Turbo | 文心X1 Turbo |
---|---|---|---|
文本理解 | ✔️ | ✔️ | ✔️ |
图像理解 | ❌ | ✔️ | ✔️ |
视频理解 | ❌ | ✔️ | ✔️ |
多模态生成 | ❌ | ✔️ | ✔️ |
推理能力 | 强 | 更强 | 最强 |
成本(对比基准) | 100% | 40% | 25% |
值得注意的是,X1 Turbo在保持高性能的同时,成本仅为DeepSeek-R1的25%。这种性价比优势对开发者极具吸引力,可能改变大模型市场的竞争格局。
生态建设:MCP协议支持与沧舟OS的技术布局
百度在本次大会上还展示了其AI生态建设的雄心,主要体现在对MCP协议的支持和沧舟OS技术底座的发布。
MCP协议:AI世界的"万能插座"
MCP协议由Anthropic提出,旨在统一AI应用间的交互标准。百度智能云"千帆"平台已全面兼容MCP,这意味着:
- 百度生态内的应用可以无缝调用支持MCP的第三方工具
- 开发者可以更便捷地将产品接入百度生态
- 企业用户能够整合不同来源的AI能力
这种开放性策略有助于百度构建更强大的开发者生态。
沧舟OS:多模型协同的技术底座
百度文库推出的沧舟OS为解决多模型协同问题提供了创新方案。其核心架构包括:
- Chatfile Plus层:实现多模态内容的向量化统一处理
- 三库三器系统:提供知识管理、内容创作的全套工具
基于这一技术,百度网盘新增的"AI笔记"功能能够实现:
- 视频内容自动结构化
- 知识点时间戳溯源
- 多模态笔记生成
这种深度整合内容管理与AI能力的产品思路,展现了百度在知识服务领域的独特优势。
总结与展望:百度AI战略的三大关键点
通过本次Create大会,我们可以清晰看到百度的AI战略聚焦于:
- 场景深耕:在电商、内容等领域找到AI落地的真实场景
- 技术差异化:通过多模态和成本优势建立竞争壁垒
- 生态开放:以MCP等标准推动开发者生态繁荣
李彦宏强调:"应用才是真正创造价值的。"这句话揭示了百度AI发展的核心理念——技术必须服务于实际场景。随着多模态模型、Agent技术的成熟,AI正从炫技阶段走向价值创造阶段。百度此次展示的产品矩阵,让我们看到了AI规模化商用的更多可能性。
未来1-2年,AI行业可能会呈现以下趋势:
- 多模态成为大模型标配
- Agent应用呈现爆发式增长
- 模型成本持续下降推动普及
- 标准化协议促进生态融合
百度能否在这些趋势中保持领先地位,取决于其技术迭代速度和生态建设能力。但无论如何,本次Create大会已经证明,中国AI产业正朝着更加务实、更加开放的方向发展。
相关文章:
百度Create大会深度解读:AI Agent与多模态模型如何重塑未来?
目录 百度Create大会亮点全解析:从数字人到Agent生态布局 数字人商业化:从"拟人"到"高说服力"的进化 Agent生态:从"心响"App看百度的Agent战略布局 "心响"App的技术架构与创新点 多模态大模型&a…...
新能源汽车运动控制器核心芯片选型与优化:MCU、DCDC与CANFD协同设计
摘要:随着新能源汽车产业的迅猛发展,汽车运动控制器的性能和可靠性面临着更高的要求。本文深入探讨了新能源汽车运动控制器中MCU(微控制单元)、DCDC电源管理芯片和CANFD总线通信芯片的选型要点、优化策略及其协同设计方案。通过综…...
【软件工程】 白盒测试简介
1. 前言 在软件测试过程中,白盒测试(White-box Testing)是一种重要方法,它通过检查程序内部结构来验证软件功能。本文以一道典型的伪代码程序为例,结合白盒测试的基本操作,设计语句覆盖测试用例࿰…...
uniapp自定义一个选择年月日时分的组件。
<template><view><u-popup :show"timePopShow" mode"bottom" close"close" open"open" :closeOnClickOverlay"true"><view class"popup-container"><!-- 自定义时间内容 --><vi…...
Git命令(Gitee)
三板斧: git init //初始化本地仓库 git add . //添加所有文件到缓存区 (或指定文件) git commit -m "备注" //提交,填写备注 git remote add origin <远程仓库链接> git push -u origin ma…...
Node.js 应用部署:镜像体积优化与安全的多阶段构建探索
Node.js 应用部署:镜像体积优化与安全的多阶段构建探索 在开发 Node.js 应用时,部署过程中的镜像体积优化和安全性保障是至关重要的环节。本文将通过两种不同的 Docker 部署方式,深入探讨如何实现高效的镜像体积优化和安全的部署环境。 传统的单阶段构建方式 许多开发者在…...
深度解析:Web Crawling与Web Scraping的区别与联系
在现代互联网数据驱动的时代,Web Crawling(网页爬取)和Web Scraping(网页抓取)成为数据采集领域的两大核心技术。尽管两者常被混用,但它们在技术实现、应用目的和操作流程上存在显著差异。本文将基于权威资料,特别是维基百科的定义࿰…...
C# 利用log4net 工作台打印和保存到文件
目录 log4net简介引言1、添加引用库2、添加引用和构建实例3、添加属性配置4、添加配置文件最后 log4net简介 log4net是一个开源的日志记录组件,专为.NET平台设计。它是Apache log4j框架在Microsoft .NET平台的实现,属于Apache Logging Servic…...
2025 VSCode中如何进行dotnet开发环境配置完整教程
我一直都是用Visual Studio 2019来开发C#项目的,用的比较顺手,也习惯了。看其他技术文章有介绍VS Code更轻量,更方便。 所以就想来研究如何使用VS Code,看看它是如何构建代码、调试代码、如何运行C#应用程序。 本文将详细介绍如何…...
vscode本地化显示远程图形化界面
远程登陆到服务器端 sudo vim /etc/ssh/sshd_config修改文件中的参数,保存。主要参数如下 配置好上述后需要reload一下ssh,安装xclock。 service ssh reload # 安装x11-apps,这样就可以使用xclock apt install x11-apps查看环境变量,在其中并没有DISPL…...
STM32 CAN通信 HAL库实战教程:从零到测试成功
STM32 CAN通信 HAL库实战教程:从零到测试成功 <我打印的是陀螺仪的数据> 目录 简介:为什么学习CAN通信CAN通信基础概念STM32 CAN硬件配置CAN初始化详解CAN数据发送实现CAN数据接收实现测试与验证方法常见问题与解决总结与拓展 1. 简介࿱…...
数据结构强化篇
应用题 排序 插入排序 void InsertSort (ElemType A[], n int) {int i, j;for (i2; i<n; i) //依次将 A[2]~A[n]插入前面已排序序列if (A[i]<A[i-1]) { //若 A[i]关键码小于其前驱,将 A[i]插入有序表A[0]A[i]; //复制为哨兵,A[0]不存放…...
泰迪杯实战案例超深度解析:旅游景点游客流量预测与资源优化
(2025年泰迪杯数据挖掘挑战赛D题特等奖案例) 一、案例背景与目标 1.1 应用场景与痛点 某5A级景区面临以下核心问题: 拥堵严重:节假日热门景点游客密度超过10人/㎡,排队时间长达2小时。 资源浪费:接驳车空载率30%,餐饮点位在非高峰时段闲置率60%。 应急滞后:突发降雨或…...
qt 3d航迹图
一般就是三种方法 1.opengl,vtk这种从零自己画,网上也可能有半成品,大多是付费的。 2.重写qwt3d,07年就停止更新了,画出来类似opengl,需要自己修改参数,参数修改不对很难搞,对于经…...
探索排序算法的奥秘(上):冒泡排序、选择排序、插入排序
在计算机科学中,排序算法是数据处理的基础工具之一。通过对数据进行有序排列,可以极大地提高数据检索和处理的效率。本文将详细介绍三种经典的排序算法:冒泡排序、选择排序和插入排序。我们将从算法思想、原理、代码实现(C语言、P…...
Stable Diffusion 技术全景解析与行业竞争力分析
目录 一、Stable Diffusion 技术概览 1. 核心背景 2. 技术架构 二、行业地位与竞品对比 1. 市场定位 2. 核心竞争优势 三、部署成本与硬件要求 1. 硬件配置方案 2. 优化技巧 四、优势与劣势分析 1. 核心优势 2. 主要劣势 五、开源策略与商业模型 1. 开源协议 2. …...
基于Python的DeepSeek API图形界面开发
基于Python的DeepSeek API图形界面开发 在人工智能技术广泛应用的今天,如何将强大的API能力与用户友好的界面结合,成为开发者关注的重点。本文将以DeepSeek API为例,详解如何通过Python构建兼具功能性与美观度的GUI应用程序。 一、技术架构…...
w~嵌入式C语言~合集4
我自己的原文哦~ https://blog.51cto.com/whaosoft/13870376 一、STM32怎么选型 什么是 STM32 STM32,从字面上来理解,ST是意法半导体,M是Microelectronics的缩写,32表示32位,合起来理解,STM32就是指S…...
自动驾驶(ADAS)领域常用数据集介绍
1. KITTI 数据集 简介:由德国卡尔斯鲁厄理工学院与丰田研究院联合创建,是自动驾驶领域最经典的评测基准,涵盖立体视觉、光流、3D检测等任务。包含市区、乡村和高速公路场景的真实数据,标注对象包括车辆、行人等,支持多…...
【嵌入式八股23】Linux关键指令
系统关机命令 在 Linux 系统中,有多种命令可用于实现系统关机或重启操作,以下为你详细介绍各命令及其特点: 指令 说明 shutdown该命令能够安全地将系统关机。它允许用户指定关机的时间,还可以在关机前向所有登录用户发送警告消息。例如,shutdown -h now 可立即关机,shu…...
机器学习的一百个概念(13)布里尔分数
前言 本文隶属于专栏《机器学习的一百个概念》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见[《机器学习的一百个概念》 ima 知识库 知识库广场搜索: 知识库创建人机器学习@Shockang机器学习数学基础@Shocka…...
AI提示词(Prompt)终极指南:从入门到精通(附实战案例)
在AI重塑工作方式的今天,掌握Prompt工程已成为智能时代的必备技能。本指南系统解析提示词设计精髓,从认知底层逻辑到实战应用技巧,带您解锁AI工具的完整潜能。涵盖主流模型选型策略、三大黄金法则、结构化模板及典型避坑指南,更有…...
鸿蒙版电影app设计开发
鸿蒙电影购票APP项目介绍 一、项目概述及使用方式 (一)项目概述 在智能手机与移动互联网蓬勃发展的当下,移动设备已成为人们生活不可或缺的一部分,而电影购票这一日常娱乐消费行为也日益向移动端迁徙。鸿蒙系统作为新兴力量&…...
如何启动jar包隐藏cmd窗口
要启动一个JAR文件并隐藏命令行窗口(cmd),你可以使用不同的方法,具体取决于你的操作系统。以下是几种常见的方法: 在Windows中使用批处理文件 你可以创建一个批处理文件(.bat文件),…...
【Redis】基础3:一些应用场景
文章目录 1. session管理1.1 手机号登录流程1.2 session的数据结构设计1.2.1 一些概念1.2.2 session数据结构例子 1.3 引入redis来实现共享session1.3.1 流程发送验证码短信的流程验证码登录流程登录检查流程 1.3.2 要考虑的问题 2. 限时抢购代金券2.1 业务流程2.2 代金券表设计…...
【创新实训个人博客】multi-agent调研(2)
下面的部分我们将简单介绍现有的三个multi-agent框架,并对它们进行简单的比较 multi-agent框架分析 MetaGPT 相关资料 代码repo:https://github.com/geekan/MetaGPT论文:https://arxiv.org/pdf/2308.0035 AgentVerse 相关资料 代码repo&…...
对鸿蒙 Next 系统“成熟论”的深度剖析-优雅草卓伊凡
对鸿蒙 Next 系统“成熟论”的深度剖析-优雅草卓伊凡 在科技飞速发展的当下,鸿蒙 Next 系统无疑成为了众多科技爱好者与行业人士关注的焦点。今日,卓伊凡便收到这样一个饶有趣味的问题:鸿蒙 Next 系统究竟需要多长时间才能完全成熟ÿ…...
模方ModelFun瓦片数据操作教程
摘要:本文主要介绍模方ModelFun瓦片数据操作,包含:打开/关闭瓦片数据,备份和恢复,导出 OBJ/ OSGB,导出DOM/DSM。 1.打开/关闭瓦片数据 在“总体模型视图/OSGB”里对 tiles 进行操作:选择&…...
RabbitMQ应用(基于腾讯云)
1.防火墙配置 关于RabbitMQ的远程,主要有4个端口需要开通【入站规则】,分别是: 端口 5672:这是 RabbitMQ 的默认 AMQP(Advanced Message Queuing Protocol)端口,用于客户端与 RabbitMQ 服务器之…...
堆和二叉树的概念和操作
目录 1.树的概念 1.1数的表示 1.2二叉树 1.3特殊的二叉树 1.3.1满二叉树 1.3.2完全二叉树 1.3.3 二叉树存储结构 2.堆 2.1堆的实现 初始化和销毁 堆的插入 堆的向上调整算法编辑 编辑 堆的删除 出堆顶 1.树的概念 树是非线性的数据结构,有限节点具有的层…...
互联网大厂Java面试实录:从Spring Boot到微服务架构的技术问答
互联网大厂Java面试实录:从Spring Boot到微服务架构的技术问答 在某互联网大厂的面试现场,严肃的面试官开始了对求职者谢飞机的技术考核。此次面试围绕Java技术栈的应用与场景展开。 第一轮:基础架构与语言 面试官: 请你用简单…...
Rollup、Webpack、Esbuild 和 Vite 前端打包工具
Rollup、Webpack、Esbuild 和 Vite 都是前端开发中常用的打包工具,它们各有特点,以下是对它们的详细对比: 核心功能 Rollup:专注于 JavaScript 模块打包,擅长将小的 JavaScript 模块打包成一个或多个文件,…...
刀客独家 | 潘胜接管百度移动生态市场部
一、 据刀客doc向独家信源确认,百度移动生态事业群(MEG)市场部日前完成重要人事调整:潘胜已经接任市场负责人。 此前,根据雷锋网3月底的报道,百度云渠道生态总经理陈之若离职,原移动生态事业群…...
如何在Chrome浏览器中启用硬件加速【提升浏览器性能】
在使用谷歌浏览器时,硬件加速是提升性能的一个重要功能。它可以将一些计算任务从CPU转移到GPU,从而加速图像处理、视频播放等任务。如果您希望提升浏览器的运行速度,可以通过以下简单步骤启用硬件加速。 1. 打开Chrome浏览器设置 首先&#…...
部署mongodb三幅本集群
背景:原先使用的mongodb采用的是SSPL协议,此协议客户检测到有bug,故需要替换mongodb的版本,原先采用helm部署的mongodb但是无法找到4.1.4版本的chart包,故手写yaml部署 1、部署mongodb-arbiter服务 这个服务是用来选…...
JavaScript 解构赋值(下):对象解构与高级应用
对象解构赋值 基本语法 const person { name: Alice, age: 30 }; const { name, age } person;console.log(name); // Alice console.log(age); // 30别名 const { name: fullName, age: years } person; console.log(fullName); // Alice console.log(years); // 30…...
批量级负载均衡(Batch-Wise Load Balance)和顺序级负载均衡(Sequence-Wise Load Balance)
本文主要比较了批量级负载均衡(Batch-Wise Load Balance)和顺序级负载均衡(Sequence-Wise Load Balance)在 Mixture-of-Experts(MoE)模型训练中的核心区别 。批量级负载均衡通过对整个训练批次的专家负载进行平衡约束,实现了更灵活的均衡策略,有助于专家在不同领域的专…...
什么是EI期刊?EI目录列表如何看?一文查看最新目录+避坑指南
近期有很多人在后台问小编关于EI期刊的各种问题,且前段时间EI期刊目录刚刚更新,小编正好借此,这期仔细给大家介绍一下。 什么是EI期刊? EI期刊也称为工程索引期刊,是供查阅工程技术领域文献的综合性情报检索刊物。每年…...
[创业之路-341]:华为人力资源管理 - 华为技术专家体系详解
华为技术专家体系详解 一、技术专家等级划分 华为技术专家体系以 “专业能力管理贡献” 为双维度,覆盖 19级(技术专家B)至22级(集团核心领导者),其中 19B-20A级 为核心技术专家层级: 19B级&a…...
【HarmonyOS 5】鸿蒙检测系统完整性
【HarmonyOS 5】鸿蒙检测系统完整性 一、前言 从现实安全威胁来看,设备系统完整性风险已影响至移动应用的各个场景。不少用户因使用越狱设备(Jailbreak)或非真实设备(Emulator),导致应用安全防护机制失效…...
量子网络:构建未来通信的超高速“高速公路”
在当今数字化时代,通信技术的飞速发展极大地推动了全球信息的流动和共享。然而,随着数据量的爆炸式增长和对信息安全需求的不断提高,传统通信网络正面临着前所未有的挑战。量子网络作为一种新兴的通信技术,以其超高速传输和绝对安…...
安卓触摸事件分发机制分析
1. 前言 🎯 一句话总结: 触摸事件(TouchEvent)会从 Activity 层开始,按从外到内的方式传递给每一个 ViewGroup/View,直到某个 View 消费(consume) 它,事件传递就会停止…...
Servlet (简单的servlet的hello world程序)
Servlet servlet在20年前左右,是网站开发的一种主力技术. 现在随着时间的推移,Java这个圈子中,逐渐使用spring代替了servlet.现在讲servlet,目的有两个方面. 1.spring作为一个框架.底层仍然是需要调用servlet里的一些api的,包括熟悉servlet有助于理解spring工作原理.包括spr…...
解析 OpenHarmony、HarmonyOS 与 HarmonyOS Next:优雅草卓伊凡的观点
解析 OpenHarmony、HarmonyOS 与 HarmonyOS Next:优雅草卓伊凡的观点 在科技领域,围绕操作系统的讨论从未停歇,其中 OpenHarmony、HarmonyOS 及其后续版本 HarmonyOS Next 备受瞩目。优雅草的卓伊凡对此有着深入见解,在此为大家详…...
Redis03-基础-C#客户端
零、文章目录 Redis03-基础-C#客户端 1、安装NuGet包 dotnet add package Newtonsoft.Json -v 13.0.3 dotnet add package StackExchange.Redis -v 2.8.242、操作帮助类实现 /*** 主题:Redis帮助类 功能:1、设置连接字符串、选择数据库2、String操作…...
JimuBI 积木报表 v1.9.5发布,大屏和仪表盘,免费数据可视化
项目介绍 JimuBI (积木报表BI) 是一款免费的数据可视化产品,含大屏和仪表盘、门户、移动图表,像搭建积木一样完全在线设计! 大屏采用类word风格,可以随意拖动组件,想怎么设计怎么设计,可以像百度和阿里一样…...
有关爬虫中数据库的封装——单线程爬虫
在编写爬虫程序时,数据存储是一个非常重要的环节。尤其是在单线程爬虫中,虽然并发量不大,但如果每次操作数据库都直接连接、查询、关闭,不仅代码臃肿,还容易出错,甚至影响爬虫的稳定性。 因此,…...
React19 useOptimistic 用法
用法 乐观更新 发起异步请求时,先假设请求会成功立即更新 UI 给用户反馈若请求最终失败,再将 UI 恢复到之前的状态 const [optimisticState, addOptimistic] useOptimistic(state, updateFn) 参数 state:实际值,可以是 useSta…...
简单的 shell 程序
整体思路 一个简单的 shell 程序的工作流程如下: 初始化环境:在启动时从系统获取环境变量。循环等待用户输入:不断输出命令行提示符,等待用户输入命令。解析命令:把用户输入的命令解析成可执行的格式。执行命令&…...
MIT XV6 - 1.1 Lab: Xv6 and Unix utilities - sleep
接上文 MIT XV6 - 1. 环境准备 实验正文 打开实验链接 Lab: Xv6 and Unix utilities ,可以看到他一共有6个小实验(头大,让我们争取日拱一卒吧…): Boot xv6 (easy)sleep (easy)pingpong (easy)primes (moderate)/(hard)find (moderate)xargs (moderate…...