当前位置: 首页 > news >正文

ORION:通过视觉-语言指令动作生成的一个整体端到端自动驾驶框架

25年3月来自华中科技和小米电动汽车的论文“ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation”。

由于因果推理能力有限,端到端 (E2E) 自动驾驶方法仍然难以在交互式闭环评估中做出正确决策。当前的方法试图利用视觉-语言模型 (VLM) 强大的理解和推理能力来解决这一难题。然而,由于语义推理空间和动作空间中纯数值轨迹输出之间的差距,很少有用于 E2E 方法的 VLM 在闭环评估中表现良好。为了解决这个问题,本文提出 ORION,一个通过视觉-语言指令动作生成的整体 E2E 自动驾驶框架.ORION 独特地结合 QT-Former 来聚合长期历史上下文,大语言模型 (LLM) 用于驾驶场景推理,以及生成规划器用于精确轨迹预测。 ORION 进一步协调推理空间和动作空间,从而为视觉问答 (VQA) 和规划任务实现统一的端到端优化。其方法在 Bench2Drive 挑战数据集上取得令人印象深刻的闭环性能:77.74 的驾驶分数 (DS) 和 54.62% 的成功率 (SR),远超当前最先进 (SOTA) 方法,DS 和 SR 分别高达 14.28 和 19.61%。

如图所示不同 E2E 范式的比较:(a-)传统端到端方法;(b-)基于 VLM 的端到端方法;(c-)VLM-辅助的经典端到端方法;(d-)ORION方法。ORION 框架通过生成规划器建立推理和动作空间之间可微分的连接。

请添加图片描述

本文提出一个由视觉-语言模型指令动作生成的整体端到端自动驾驶框架,称为 ORION。ORION 的流程如图所示。具体而言,给定当前场景的多视角图像,ORION 首先使用视觉编码器对图像 tokens 进行编码。然后,QT-Former利用各种查询来聚合长期视觉上下文、压缩图像 tokens 并感知交通元素。随后,LLM 将压缩的场景特征和历史视觉信息与用户指令相结合,执行各种理解和推理任务并生成规划 tokens。

最后,生成规划器连接 LLM 的推理空间和轨迹的动作空间,预测由规划 tokens 决定的多模态轨迹。 ORION 通过这些核心组件有效地协调视觉-推理-行动空间,实现统一空间中场景理解和轨迹生成的协同优化。

请添加图片描述

QT-Former

为了在压缩和提取来自视觉编码器多视角图像特征 F_m 的同时,实现长期信息建模,引入基于查询的时间模块 QT-Former,如图所示。具体而言,借鉴 Q-Former3D [59],首先设置两类可学习的查询:场景查询 Q_s 和感知查询 Q_p,其中 N_s 和 N_p 分别为场景查询和感知查询的数量,C_q 为查询通道。Q_s 和 Q_p 通过自注意 (SA) 进行处理以交换信息。然后,它们在交叉注意 (CA) 模块中与具有 3D 位置编码 [37] P_m 的图像特征 F_m 进行交互。之后,感知查询被输入到多个辅助头中,用于目标检测(例如,关键目标和车道)、交通状态和动态智体的运动预测。场景查询充当表示当前场景关键信息的 tokens。

请添加图片描述

此外,用一组历史查询 Q_h 和一个长期记忆库 M 来高效地检索和存储重要的历史信息(例如,先前的路况和自我状态),其中 N_h 是历史查询的数量,n 是最大历史帧长度。利用 Q_h 通过一个 CA 块提取 M 中带有相对时间戳嵌入 P_t 的前帧查询。然后,Q_h 与另一个 CA 块中的当前场景特征 Q_s 进行交互,从而提取与当前场景相关的细节。

随后,更新后的历史查询 Qˆ_h 按照先进先出 (FIFO) 替换策略存储在记忆 M 中。

虽然一些方法 [51, 58] 也利用记忆存储先前的信息,但它们通常仅存储压缩的历史信息,而没有指导提取当前场景信息。因此,初始化少量历史查询,以进一步提取与历史信息最密切相关的当前场景特征,从而增强模型的长期记忆能力。

最后,利用一个双层多层感知器 (MLP) 将更新后的历史查询 Qˆ_h 和当前场景特征 Q_s 转换为 LLM 推理空间中的历史 tokens x_h 和场景 tokens x_s。

大语言模型

LLM 在其框架中至关重要,因为对当前驾驶场景进行高质量的推理,对于指导生成式规划器在行动空间中生成合理的轨迹至关重要。

用户指令首先由文本 token 化器编码为语言 token x_q,其中 L 为 token 长度,C 为 LLM 的维度。然后,场景token x_s 和历史 token x_h 与语言 token x_q 组合并输入 LLM。

借助 LLM 丰富的世界知识和卓越的推理能力,ORION 可以在驾驶场景中执行各种基于文本的理解和推理任务,包括场景描述、历史信息回顾、场景分析和动作推理。同时,其设计一个规划问答模板,其中 LLM 带有一个特殊的规划 token s,作为最终的问答,将整个驾驶场景的理解和推理上下文积累到 s 中,正式写为:s ∼ p(s|x_s, x_h, x_q, x_a),其中 x_a 表示 LLM 的生成答案。规划 token s 的嵌入将作为控制轨迹生成的条件。

然而,在闭环仿真环境中仍然缺乏高质量的 VQA 注释来训练 LLM 全面理解驾驶场景。因此,通过由 Qwen2-VL [57] 驱动的全自动 VQA 注释流程扩展 Bench2Drive 数据集,并提出自己的 VQA 数据集 Chat-B2D,希望进一步推动 VLM 在闭环仿真领域的研究。

生成式规划器

生成式模型 [14, 28, 48] 可以通过学习数据分布来有效地捕捉数据的内在特征。最近的研究 [5, 38, 47] 证明了不同模态数据的潜空间之间存在语义相关性,调整一个模态空间的分布参数可以精确控制另一个模态空间的生成过程。

受生成式领域的启发,本文引入一个生成式规划器来弥合推理和动作空间之间的差距。具体而言,将动作空间中的当前轨迹 a 表示为条件概率分布 p(a|s),其中 s 是规划 tokens。为了构造 p(a|s),生成领域有许多优秀的方法(例如变分自编码器 (VAE) [28] 和扩散模型 [48])。

由于 VLM 的推理空间和轨迹的动作空间在分布上存在本质区别,使用 VAE [28] 模型将它们在高斯分布中对齐。采用两层 MLP 将状态 s 和真实轨迹 t 投影到潜空间中的高斯变量 z 中。

然后,用 Kullback-Leibler 散度损失来强制执行分布匹配。最后,使用 GenAD [70] 中的 GRU 解码器从潜空间 z 解码轨迹。注:本文 VAE 函数与 GenAD 中的 VAE 不同。其仅使用从自身车辆视角在推理空间中编码的单个 token 作为输入,旨在弥合推理空间和动作空间之间的差距。相比之下,后者利用在 BEV 空间中编码的所有智体特征作为输入,旨在学习自车和其他智体高度结构化轨迹的特定模式。

此外,也还尝试用其他生成模型(例如用于轨迹生成的扩散模型)替代 VAE。得益于所提出的方法,通过潜空间中的分布学习来弥合推理和动作空间之间的差距,该框架与其他方法相比仍然表现出优异的性能。

训练目标

对于所提出的 QT-Former 的检测任务,检测损失定义为 L_det = L_cls + L_reg,其中 L_cls 为焦点损失 [34],L_reg 为 L1 损失。对于交通状态和运动预测,损失分别定义为 L_tra 和 L_m = L_mcls + L_mreg,其中 L_tra 和 L_mcls 为焦点损失,L_mreg 为 L1 损失。

对于 LLM,利用自回归交叉熵损失 L_ce。对于框架中的生成规划器,L_vae 是 Kullback-Leibler 散度损失,用于对齐推理空间和动作空间。遵循 VAD [25],采用碰撞损失 L_col、边界损失 L_bd 和 MSE 损失 L_mse 进行规划预测。

模型设置。与 Bench2Drive 上的经典 E2E 基线 [18, 25, 70] 一致,ORION 是一种完全无需高清地图的方法,仅使用导航指令 (NC) 作为轨迹预测的输入条件,而非车道中心(即目标点,TP)的位置。ORION 是一种无需锚点的方法,输出 6 种模式轨迹预测,分别对应于 Bench2Drive 中定义的 6 个 NC。

训练过程。所有实验均在 32 块 NVIDIA A800 GPU(配备 80 GB 内存)上进行。遵循 Omnidrive [59] 的方法,采用 EVA-02-L [12] 作为视觉编码器。 ORION 采用 Vicuna v1.5 [69] 版本,并使用 LoRA [16] 进行微调,秩维度和 alpha 均设置为 16。场景、感知和历史查询的默认数量分别为 512、600 和 16。将记忆库的存储帧数 n 设置为 16。训练期间,会对输入图像进行数据增强,首先将图像调整为 640 × 640 的分辨率。

标注流水线。如图所示,自动注释流程包含三个步骤:

请添加图片描述

关键目标选择。与主流自动驾驶感知模块平等处理所有检测的目标不同,强调识别可能影响自车驾驶行为的关键目标,这种识别基于人类驾驶策略。选择标准包括:1)目标在三秒内可能发生碰撞。2)当前车道和相邻车道上的前导车辆。3)主动交通信号灯。4)弱势道路使用者 (VRU),例如行人/骑行者。

描述生成。提取包含当前帧和前五帧的视频片段。随后,这些片段与自车状态以及所选关键目标的真值信息(例如 2D/3D 坐标和速度等)一起作为 Qwen2VL-72B [57] 的输入,进行多任务生成:1)场景描述; 2) 关键目标的属性及其对自身车辆的影响;3) 自主导航的操作元命令和动作推理。

历史信息。在生成过程中,采用队列机制来保存重要的历史信息。存储的信息主要包含两个部分:1) 环境动态,用于捕捉关键场景元素的时空变化;2) 通过比较分析当前速度/动作与前几帧中的历史对应速度/动作得出的自身运动特征。

生成的描述和收集的历史信息与预定义的问题模板相结合,创建 VQA 对。

相关文章:

ORION:通过视觉-语言指令动作生成的一个整体端到端自动驾驶框架

25年3月来自华中科技和小米电动汽车的论文“ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation”。 由于因果推理能力有限,端到端 (E2E) 自动驾驶方法仍然难以在交互式闭环评估中做出正确决策。当前的方…...

python全栈-flask

python全栈-flask 文章目录 入门上手hello worldflask运行方式测试路由with app.test_request_context():debug模式配置flask参数动态路由数据类型自定义转换器to_pythonPostMan(API测试查询参数的获取请求体参数上传文件其它参数url_for 函数重定向响应内容自定义响…...

Unity中的数字孪生项目:两种输入方式对观察物体的实现

在数字孪生项目中,精确的相机控制至关重要。相机不仅需要灵活地跟随目标,还要能够平滑地旋转和缩放,以便观察和分析物体的各个细节。今天,我将通过 TouchControlCamera 和 CameraRotate 两个脚本,展示如何实现一个适用…...

ECharts散点图-散点图14,附视频讲解与代码下载

引言: ECharts散点图是一种常见的数据可视化图表类型,它通过在二维坐标系或其它坐标系中绘制散乱的点来展示数据之间的关系。本文将详细介绍如何使用ECharts库实现一个散点图,包括图表效果预览、视频讲解及代码下载,让你轻松掌握…...

【教程】Digispark实现串口通信

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 没想到这么老&#xff0c;很多代码都不能用&#xff0c;修了好久。。。 TinySoftwareSerial.cpp #include <stdlib.h> #include <stdio.h&g…...

GPT-4.1 开启智能时代新纪元

GPT-4.1 全解析&#xff1a;开启智能时代新纪元&#xff08;含费用详解&#xff09; 2025年4月&#xff0c;OpenAI 正式推出全新一代语言模型——GPT-4.1 系列&#xff0c;包括 GPT-4.1、GPT-4.1 Mini 和 GPT-4.1 Nano。相比以往模型&#xff0c;它在代码生成、指令理解、长文本…...

4.21 spark和hadoop的区别与联系

一、Hadoop 1. 定义 Hadoop是一个由Apache基金会开发的分布式系统基础架构。它最初是为了解决大规模数据存储和处理的问题而设计的。Hadoop的核心组件包括HDFS&#xff08;Hadoop Distributed File System&#xff09;和MapReduce。 2. HDFS&#xff08;Hadoop Distributed Fi…...

Nacos 客户端 SDK 的核心功能是什么?是如何与服务端通信的?

Nacos 客户端 SDK 的核心功能 Nacos 客户端 SDK 是应用程序集成 Nacos 能力的桥梁&#xff0c;它封装了与 Nacos 服务端交互的复杂性&#xff0c;为开发者提供了简单易用的 API。其核心功能主要围绕两大方面&#xff1a;服务发现 和 配置管理。 服务发现 (Service Discovery) …...

servlet-保存作用域

保存作用域 保存作用域&#xff1a;原始情况下&#xff0c;保存作用域我们有四个&#xff1a;page(一般不用了) 、request&#xff08;一般请求响应范围&#xff09;、session(一次会话范围)、application(整个应用程序范围)1&#xff09;request&#xff1a;一般请求响应范围…...

从规则到大模型:知识图谱信息抽取实体NER与关系RE任务近10年演进发展详解

摘要&#xff1a; 本文回顾了关系抽取与实体抽取领域的经典与新兴模型&#xff0c;清晰地梳理了它们的出现时间与核心创新&#xff0c;并给出在 2025 年不同资源与场景下的最佳实践推荐。文章引用了 BiLSTM‑CRF、BiLSTM‑CNN‑CRF、SpanBERT、LUKE、KnowBERT、CasRel、REBEL、…...

【自然语言处理与大模型】模型压缩技术之蒸馏

知识蒸馏是一种模型压缩技术&#xff0c;主要用于将大型模型&#xff08;教师模型&#xff09;的知识转移到更小的模型&#xff08;学生模型&#xff09;中。在大语言模型领域&#xff0c;这一技术特别重要。 知识蒸馏的核心思想是利用教师模型的输出作为软标签&#xff08;sof…...

yum如果备份已经安装的软件?

在 CentOS 系统中&#xff0c;你可以通过以下步骤将 yum 下载的组件打包备份到本地&#xff1a; 方法 1&#xff1a;使用 yumdownloader 直接下载 RPM 包 1. 安装 yum-utils 工具 yum install -y yum-utils2. 下载指定软件包及其依赖 yumdownloader --resolve <package-n…...

室外摄像头异常自检指南+视频监控系统EasyCVR视频质量诊断黑科技

室外监控摄像头在安防监控系统运行中&#xff0c;常出现连接不畅、设备互认失败等问题。今天我们来介绍两类安防监控摄像头的典型问题及排查步骤。 问题1&#xff1a;同品牌新摄像头无法被老录像机识别 排查步骤&#xff1a; 1&#xff09;供电检查 确认摄像头供电线路连接正…...

从本地存档到协作开发的Git简单使用

概念 工作区 : 在本地实际进行文件操作的目录 .暂存区 : 类似于缓冲区 , 用于记录准备进行下一次提交的内容 .本地仓库 : 储存在本地的完整版本库 , 包含项目的提交历史 , 分支信息和标签等 .远程仓库 : 部署在远程服务器的版本库 , 通常用于协作开发 . 文件状态 Untracked …...

在 Android 中实现通话录音

在 Android 中实现通话录音需要处理系统权限、通话状态监听和音频录制等关键步骤。以下是详细实现代码及注释&#xff0c;注意不同 Android 版本和厂商设备的兼容性问题&#xff1a; 1. 添加权限声明&#xff08;AndroidManifest.xml&#xff09; <!-- 录制音频权限 -->…...

系统分析师知识点:访问控制模型OBAC、RBAC、TBAC与ABAC的对比与应用

在信息安全领域&#xff0c;访问控制是确保数据和资源安全的关键技术。随着信息系统复杂度的提高&#xff0c;访问控制技术也在不断演进&#xff0c;从早期简单的访问控制列表(ACL)发展到如今多种精细化的控制模型。本文将深入剖析四种主流的访问控制模型&#xff1a;基于对象的…...

网络原理(TCP协议—协议格式,性质(上),状态)

目录 1.TCP协议段格式。 2.TCP协议传输时候的性质。 2.1确认应答。 2.2超时重传。 2.3连接管理。 2.3.1 三次握手。 2.3.2四次挥手。 3.TCP常见的状态。 1.TCP协议段格式。 TCP协议段是由首部和数据两部分构成的。首部包含了TCP通信所需要的各种控制信息&#xff0c;而…...

用全新发布的ChatGPT-o3搜文献写综述、专业审稿、降重润色,四个步骤轻松搞定全部论文难题!

今天和大家聊聊OpenAI近期发布的o系列模型中的两个大成果:o3和o4-mini,这个系列的模型最大特点是经过训练,会在响应之前进行更长时间的思考,给出更深入的回答。 下面文章七哥会为大家深度讲解o3模型在学术研究和论文写作方面的四大优势,并附上实用有效的使用技巧和步骤供…...

多路由器通过RIP动态路由实现通讯(单臂路由)

多路由器通过RIP动态路由实现通讯&#xff08;单臂路由&#xff09; R1(开启端口并配置IP) Router>en Router#conf t Router(config)#int g0/0 Router(config-if)#no shu Router(config-if)#no shutdown Router(config-if)#ip add 192.168.10.254 255.255.255.0 Router(c…...

分数线降低,25西电马克思主义学院(考研录取情况)

1、马克思主义学院各个方向 2、马克思主义学院近三年复试分数线对比 学长、学姐分析 由表可看出&#xff1a; 1、马克思主义理论25年相较于24年下降10分&#xff0c;为355分 3、25vs24推免/统招人数对比 学长、学姐分析 由表可看出&#xff1a; 1、 马克思主义学院25年共接…...

反转字符串

344. 反转字符串 题目 思路 双指针 设 s 长度为 n。反转可以看成是交换 s[0] 和 s[n−1]&#xff0c;交换 s[1] 和 s[n−2]&#xff0c;交换 s[2] 和 s[n−3]&#xff0c;依此类推。 代码 class Solution:def reverseString(self, s: List[str]) -> None:""&q…...

乾元通渠道商中标舟山市自然灾害应急能力提升工程基层防灾项目

近日&#xff0c;乾元通渠道商中标舟山市自然灾害应急能力提升工程基层防灾项目&#xff08;结余资金&#xff09;装备采购项目&#xff0c;乾元通作为设备厂家&#xff0c;为项目提供通信指挥类装备&#xff08;多链路聚合设备&#xff09;QYT-X1。 青岛乾元通数码科技有限公司…...

‌信号调制与解调技术基础解析

调制解调技术是通信系统中实现基带信号与高频载波信号相互转换的主要技术&#xff0c;通过调整信号特性使其适应不同信道环境&#xff0c;保障信息传输的效率和可靠性。 调制与解调的基本概念 调制&#xff08;Modulation&#xff09;‌ 将低频基带信号&#xff08;如语音或数…...

多源异构网络安全数据(CAPEC、CPE、CVE、CVSS、CWE)的作用、数据内容及其相互联系的详细分析

1. CWE&#xff08;Common Weakness Enumeration&#xff09; 作用&#xff1a;CWE 是常见软件和硬件安全弱点的分类列表&#xff0c;用于描述漏洞的根本原因&#xff08;如代码缺陷、逻辑错误等&#xff09;&#xff0c;为漏洞的根源分析提供框架。数据内容&#xff1a; 弱点…...

02_Flask是什么?

一、视频教程 02_Flask是什么 二、Flask简介 Flask 框架诞生于2010 年&#xff0c;是由 Armin 使用 Python 语言基于 Werkzeug 工具箱编写的轻量级Web开发框架。Armin 是 Python 编程语言的核心开发者之一&#xff0c;同时也是 Flask 项目的主要贡献者。 Flask主要依赖于两个核…...

突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案

突破网页数据集获取难题&#xff1a;Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案 背景 随着AI技术的飞速发展&#xff0c;诸如DeepSeek R1、千问QWQ32、文小言、元宝等AI大模型迅速崛起。在AI大模型训练和微调、AI知识库建设中&#xff0c;数据集的获取已成为不…...

Spark-SQL与Hive集成及数据分析实践

一、Spark-SQL连接Hive的配置 Spark-SQL支持与Hive无缝集成&#xff0c;可通过以下方式操作Hive&#xff1a; 1. 内嵌Hive&#xff1a;无需额外配置&#xff0c;直接使用&#xff0c;但生产环境不推荐。 2. 外部Hive&#xff1a; 将hive-site.xml、core-site.xml、hdfs-site…...

CI/CD

CI/CD 是一种用于软件开发和交付的实践方法&#xff0c;由持续集成&#xff08;Continuous Integration&#xff09;、持续交付&#xff08;Continuous Delivery&#xff09;和持续部署&#xff08;Continuous Deployment&#xff09;三个关键环节组成&#xff0c;以下是具体介…...

【橘子大模型】Tools/Function call

一、简介 截止目前&#xff0c;我们对大模型的使用模式仅仅是简单的你问他答。即便是拥有rag&#xff0c;也只是让大模型的回答更加丰富。但是大模型目前为止并没有对外操作的能力&#xff0c;他只是局限于他自己的知识库。 举个例子&#xff0c;到今天4.21为止&#xff0c;你…...

解决Mac 安装 PyICU 依赖失败

失败日志&#xff1a; 解决办法 1、使用 homebrew 安装相关依赖 brew install icu4c 安装完成后&#xff0c;设置环境变量 echo export PATH"/opt/homebrew/opt/icu4c77/bin:$PATH" >> ~/.zshrcecho export PATH"/opt/homebrew/opt/icu4c77/sbin:$PATH…...

Kafka 生产者的幂等性与事务特性详解

在分布式消息系统中&#xff0c;消息的可靠性传输是一个核心问题。Kafka 通过幂等性&#xff08;Idempotence&#xff09;和事务&#xff08;Transaction&#xff09;两个重要特性来保证消息传输的可靠性。幂等性确保在生产者重试发送消息的情况下&#xff0c;不会在 Broker 端…...

ubuntu--汉字、中文输入

两种输入框架的安装 ibus 链接 (这种方式安装的中文输入法不是很智能&#xff0c;不好用)。 Fcitx 链接这种输入法要好用些。 简体中文检查 fcitx下载和配置 注意&#xff1a;第一次打开fcitx-config-qt或者fcitx configuration可能没有“简体中文”&#xff0c;需要把勾…...

LabVIEW 开发中数据滤波方式的选择

在 LabVIEW 数据处理开发中&#xff0c;滤波是去除噪声、提取有效信号的关键环节。不同的信号特性和应用场景需要匹配特定的滤波方法。本文结合典型工程案例&#xff0c;详细解析常用滤波方式的技术特点、适用场景及选型策略&#xff0c;为开发者提供系统性参考。 ​ 一、常用…...

【图像轮廓特征查找】图像处理(OpenCV) -part8

17 图像轮廓特征查找 图像轮廓特征查找其实就是他的外接轮廓。 应用&#xff1a; 图像分割 形状分析 物体检测与识别 根据轮廓点进行&#xff0c;所以要先找到轮廓。 先灰度化、二值化。目标物体白色&#xff0c;非目标物体黑色&#xff0c;选择合适的儿值化方式。 有了轮…...

丝杆升降机蜗轮蜗杆加工工艺深度解析:从选材到制造的全流程技术要点​

在机械传动领域&#xff0c;丝杆升降机凭借其高精度、大负载等优势&#xff0c;广泛应用于自动化设备、精密仪器等众多场景。而蜗轮蜗杆作为丝杆升降机的核心传动部件&#xff0c;其加工工艺的优劣直接决定了设备的传动效率、使用寿命及稳定性。本文将深入剖析丝杆升降机蜗轮蜗…...

git远程分支重命名(纯代码操作)

目录 步骤 1&#xff1a;重命名本地分支 步骤 2&#xff1a;推送新分支到远程 简单讲讲&#xff1a; 2.1.-u 和 --set-upstream 的区别 2.2. 为什么需要设置上游&#xff08;upstream&#xff09;&#xff1f; 示例对比&#xff1a; 2.3. 如何验证是否设置成功&#xff…...

《AI大模型应知应会100篇》第31篇:大模型重塑教育:从智能助教到学习革命的实践探索

第31篇&#xff1a;大模型重塑教育&#xff1a;从智能助教到学习革命的实践探索 摘要 当北京大学的AI助教在凌晨三点解答学生微积分难题&#xff0c;当Khan Academy的AI导师为每个学生定制专属学习路径&#xff0c;我们正见证教育史上最具颠覆性的技术变革。本文通过真实教育…...

安装Github软件详细流程,win10系统从配置git到安装软件详解,以及github软件整合包制作方法(

win10系统部署安装开源ai必备 一、安装git应用程序&#xff08;用来下来github软件&#xff09; 官网下载git的exe可执行文件&#xff0c;Git - Downloads 或者这里下夸克网盘分享 运行git应用程序&#xff0c;一路’Next’到底即可。 配置安装路径 此时如果直接运行git命…...

重构・协同・共生:传统代理渠道数字化融合全链路解决方案

当 90 后经销商开始用直播卖家电&#xff0c;当药品流向数据在区块链上实时流转&#xff0c;传统代理渠道正在经历一场「数字觉醒」。面对流量碎片化、运营低效化的行业痛点&#xff0c;如何让扎根线下数十年的渠道网络&#xff0c;在数字化平台上焕发新生&#xff1f;蚓链提炼…...

智驱未来:AI大模型重构数据治理新范式

第一章 数据治理的进化之路 1.1 传统数据治理的困境 在制造业巨头西门子的案例中&#xff0c;其全球200个工厂每天产生1.2PB工业数据&#xff0c;传统人工清洗需要300名工程师耗时72小时完成&#xff0c;错误率高达15%。数据孤岛问题导致供应链决策延迟平均达48小时。 1.2 A…...

信息收集之hack用的网络空间搜索引擎

目录 1. Shodan 2. Censys 3. ZoomEye 4. BinaryEdge 5. Onyphe 6. LeakIX 7. GreyNoise 8. PulseDive 9. Spyse 10. Intrigue 11. FOFA (Finger Of Find Anything) 12. &#x1f50d; 钟馗之眼 (ZoomEye) 总结 对于黑客、网络安全专家和白帽子工程师来说&#xf…...

青少年编程与数学 02-018 C++数据结构与算法 01课题、算法

青少年编程与数学 02-018 C数据结构与算法 01课题、算法 一、算法的定义二、算法的设计方法1. 分治法2. 动态规划法3. 贪心算法4. 回溯法5. 迭代法6. 递归法7. 枚举法8. 分支定界法 三、算法的描述方法1. **自然语言描述**2. **流程图描述**3. **伪代码描述**4. **程序设计语言…...

LangChain、LlamaIndex 和 ChatGPT 的详细对比分析及总结表格

以下是 LangChain、LlamaIndex 和 ChatGPT 的详细对比分析及总结表格&#xff1a; 1. 核心功能对比 工具核心功能LangChain框架&#xff0c;用于构建端到端的 LLM 应用程序&#xff0c;支持 prompt 工程、模型调用、数据集成、工具链开发。LlamaIndex文档处理工具&#xff0c…...

基于单片机的BMS热管理功能设计

标题:基于单片机的BMS热管理功能设计 内容:1.摘要 摘要&#xff1a;在电动汽车和储能系统中&#xff0c;电池管理系统&#xff08;BMS&#xff09;的热管理功能至关重要&#xff0c;它直接影响电池的性能、寿命和安全性。本文的目的是设计一种基于单片机的BMS热管理功能。采用…...

数字虹膜:无网时代的视觉密语 | 讨论

引言&#xff1a;当网络成为枷锁 在断网即失联的当下&#xff0c;我们是否过度依赖脆弱的网络线缆&#xff1f;当两台孤立设备急需交换数据&#xff0c;传统方案或受限于物理介质&#xff0c;或暴露于无线信号被劫持的风险。有没有可能绕过所有中间节点&#xff0c;让数据像光线…...

Kubernetes相关的名词解释Container(16)

什么是Container&#xff1f; 在 Kubernetes 中&#xff0c;Container&#xff08;容器&#xff09; 是一个核心概念&#xff0c;你可以将镜像&#xff08;Image&#xff09;类比为程序的“源代码”&#xff0c;而容器是这段“代码”运行时的进程。例如&#xff0c;一个 nginx…...

腾讯云×数语科技:Datablau DDM (AI智能版)上架云应用!

在数据爆炸式增长的时代&#xff0c;传统的数据建模方式已难以满足企业对敏捷性、智能化、自动化的需求。数语科技联合腾讯云推出的 Datablau DDM 数据建模平台&#xff08;AI智能版&#xff09;&#xff0c;基于AI语义建模技术&#xff0c;深度融合腾讯混元大模型能力&#xf…...

可穿戴设备待机功耗需降至μA级但需保持实时响应(2万字长文深度解析)

可穿戴设备的功耗与响应需求之矛盾 在过去十年中&#xff0c;可穿戴设备以惊人的速度融入我们的日常生活&#xff0c;成为现代科技与个人健康管理的重要交汇点。从智能手表到健身手环&#xff0c;从医疗监测设备到增强现实眼镜&#xff0c;这些设备不仅仅是科技产品的延伸&…...

【身份证扫描件识别表格】如何识别大量身份证扫描件将内容导出保存到Excel表格,一次性处理多张身份证图片导出Excel表格,基于WPF和腾讯云的实现方案

基于WPF和腾讯云的身份证扫描件批量处理方案 适用场景 本方案适用于需要批量处理大量身份证扫描件的场景,例如: 企业人事部门批量录入新员工身份信息银行或金融机构办理批量开户业务教育机构收集学生身份信息政府部门进行人口信息统计酒店、医院等需要实名登记的场所这些场景…...

数字化补贴:企业转型的 “政策东风” 如何借力?

在数字经济浪潮席卷全球的当下&#xff0c;数字化转型已从企业的 “选修课” 变为 “生存必修课”。面对技术迭代加速与市场竞争加剧的双重压力&#xff0c;如何低成本、高效率完成转型&#xff1f;各级政府推出的数字化补贴政策&#xff0c;正成为企业借势突围的关键抓手。 政…...