当前位置：首页 > news >正文

北师大具身AI的虚拟世界扩展！UNREALZOO：为具身智能打造高逼真度的虚拟世界

news 来源：原创 2025/8/23 9:22:47

作者：Fangwei Zhong, Kui Wu, Churan Wang, Hao Chen, Hai Ci, Zhoujun Li, Yizhou Wang
单位：北京师范大学，北京航空航天大学，北京大学，BIGAI，澳门城市大学，新加坡国立大学
论文标题：UNREALZOO: ENRICHING PHOTO-REALISTIC VIRTUAL WORLDS FOR EMBODIED AI
论文链接：https://arxiv.org/abs/2412.20977
项目主页：http://unrealzoo.site/
代码链接：https://github.com/UnrealZoo/unrealzoo-gym

主要贡献

论文介绍了UnrealZoo，包含100个高质量、照片级真实感场景的合集，并提供了一系列具有多样化特征的实体，旨在应对开放世界中具身智能（Embodied AI）智能体所面临的挑战。
对UnrealCV进行了优化，提供了易于使用的Python API和工具（称为UnrealCV+），以提高渲染和多智能体交互的效率。
通过实验展示了UnrealZoo在具身AI中的应用，特别是在视觉导航和跟踪任务中的表现。实验结果强调了多样化的训练环境对于增强智能体泛化能力和鲁棒性的重要性。
提供了易于使用的OpenAI Gym接口和工具包，用于定制和扩展环境以满足未来应用的需求。

研究背景

研究问题

当前，具身AI智能体通常局限于受控的室内环境，很少探索开放世界的多样性。
论文主要解决的问题是如何增强具身智能（Embodied AI）智能体在开放世界中的适应性和泛化能力。

研究难点

该问题的研究难点包括：

在动态场景中闭环控制的延迟、
在非结构化地形中推理3D空间结构、
多智能体交互的复杂性等。

UnrealZoo

UnrealZoo是一个基于Unreal Engine构建的多样化、照片级逼真的开放世界合集。

环境合集

场景来源与构建

来源：UnrealZoo包含100个基于Unreal Engine 4和5的场景，这些场景来源于Unreal Engine Marketplace，由艺术家提供的高质量内容组成。
积累过程：这些环境是在两年内积累的，成本超过10,000美元。
多样性：环境涵盖了从古代到现代、从西方到东方、从自然景观到人造环境的广泛风格，确保了多样性和复杂性。

场景标签与分类

标签系统：每个场景都被标记为不同的特征标签，以便研究人员可以根据场景的标签选择合适的场景进行测试或训练。
分类：场景根据其类别、规模、空间结构、动态和风格进行分类。例如，场景分为室内、室外和两者兼有的类型，规模分为室内、建筑、社区和景观等级别。

场景集成

UnrealCV+集成：将UnrealCV+集成到Unreal Engine项目中，添加可控制的玩家资产到每个场景。
二进制包：由于市场购买的内容不能开源，项目被打包成可执行二进制文件，以便社区共享。这些二进制文件兼容Windows、Linux和macOS操作系统。

可控实体

实体类型

实体种类：UnrealZoo包括七种可控实体：人类、动物、汽车、摩托车、无人机、移动机器人和飞行相机。
实体数量：具体包括19个人类实体、27种动物实体、3辆汽车、14个四足机器人、3辆摩托车和1架四轴飞行器。

功能与控制

骨架与纹理：每个实体都有骨架、适当的网格和纹理，以及一个本地运动系统和导航系统。
API控制：提供一套可调用的函数，允许用户修改实体的属性，如大小、外观和相机位置，并控制运动。
导航系统：基于NavMesh，允许智能体自主导航，具备路径规划和避障能力。

视觉数据采集

摄像机系统：每个实体都配备了一个自我中心的摄像机，允许用户从智能体的第一人称视角捕捉RGB、深度、表面法线和实例级分割（对象掩码）等多种类型的图像数据。

编程接口

UnrealCV+

API优化：提供基于Python的应用编程接口（API），用于捕获数据和控制实体及场景。UnrealCV+是UnrealCV的改进版本，优化了渲染管道和通信协议以提高帧率。
并行处理：在渲染对象掩码和深度图像时启用并行处理，显著提高了大规模场景中的帧率。
批处理命令：引入批量命令协议，客户端可以同时发送一批命令到服务器，减少服务器-客户端通信的时间。

OpenAI Gym接口

标准交互：提供标准的智能体-环境交互界面，定义了交互任务并标准化了智能体-环境交互。
任务配置：用户可以通过JSON文件配置任务特定的参数，如连续和离散动作空间、绑定摄像机的位置等。
工具包：提供了一套工具包，包括环境增强、人口控制、时间膨胀等功能，帮助用户自定义环境以满足各种任务需求。

实验

视觉导航

实验设置

复杂环境：视觉导航在野外环境中引入了比传统室内场景或自动驾驶任务更高的复杂性。实验中，智能体被放置在开放世界环境中，需要通过一系列动作（如奔跑、攀爬、跳跃、蹲下）来克服无结构地形中的各种障碍，以到达目标物体。
评估指标：使用两个关键指标来评估视觉导航智能体：
- 平均回合长度（Average Episode Length, EL），表示每回合的平均步数；
- 成功率（Success Rate, SR），测量智能体成功导航到目标物体的百分比。

基线方法

在线强化学习（Online RL）：在Roof和Factory环境中分别训练RL智能体，使用分布式在线强化学习方法（如A3C）。模型输入第一人称视角的分割掩码和智能体与目标之间的相对位置，并输出直接控制信号进行导航。
GPT-4o：使用GPT-4o模型来采取行动，利用其强大的多模态推理能力。模型输入第一人称视角的图像和智能体与固定目标之间的相对位置，根据预定义的控制空间推理适当的动作。
人类玩家：人类玩家使用键盘控制智能体，类似于第一人称视频游戏。玩家从随机起点导航到固定目标，基于视觉观察做出决策。

结果

RL智能体在较简单环境中表现较好，但在复杂环境中表现不佳。
GPT-4o在两种场景中都表现不佳，表明其在复杂3D场景推理中的局限性。
人类玩家在两个任务中都表现出色，显示出当前智能体与人类之间的显著差距。

主动视觉跟踪

环境选择

环境多样性：选择四个环境类别（室内场景、宫殿、荒野、现代场景）进行评估，每个类别包含4个独立环境。实验旨在捕捉环境合集中的广泛特征，确保对智能体能力的全面评估。

评估指标

使用三个关键指标评估：

平均回合回报（Average Episodic Return, ER），提供整体跟踪性能的洞察；
平均回合长度（Average Episode Length, EL），反映长期跟踪效果；
成功率（Success Rate, SR），测量完成500步的回合百分比。

基线方法

离线强化学习（Offline RL）：扩展自最近的离线RL方法，收集离线数据集并采用原始网络架构。通过收集不同数量环境的离线数据集来分析数据多样性的影响。
VLM-based智能体：使用GPT-4o模型直接生成基于观察图像的动作，以跟踪目标人物。设计了系统提示来帮助模型理解任务并标准化输出格式。

结果分析

随着训练环境数量的增加，智能体在所有类别中的长期跟踪性能普遍提高。
在Wilds中，使用8 Envs.数据集的成功率显著提高，表明多样化的环境暴露对提高智能体在更复杂的开放世界环境中的泛化能力至关重要。

社会跟踪

动态干扰下的鲁棒性

动态干扰：在人群中进行跟踪时，智能体需要处理动态干扰。实验中，生成具有不同数量人类角色的群体作为干扰。
结果：随着干扰数量的增加，离线RL方法保持相对稳定的成功率，而GPT-4o模型在动态环境中表现不佳，显示出其在动态干扰下的局限性。

跨实体泛化

跨实体泛化：将针对人类角色训练的智能体转移到机器人狗上进行评估。结果显示成功率下降，表明研究社区应更多关注跨实体泛化。

控制频率的影响

控制频率：使用时间膨胀包装器模拟不同的控制频率。结果表明，当感知-控制循环的频率低于10 FPS时，性能显着下降。高控制频率使RL智能体在社会跟踪中表现更好，强调了在动态开放世界中完成任务时构建高效模型的重要性。

总结

论文提出了UnrealZoo，一个多样化的照片级虚拟世界合集，旨在推动具身AI研究的发展。
通过提供高质量的虚拟环境和优化的编程接口，UnrealZoo能够支持高效的单智能体和多智能体系统交互。
实验结果表明，多样化的训练环境对智能体的泛化能力和鲁棒性至关重要，而基于RL的方法在处理动态环境和社交互动方面表现出色。
未来的工作将继续丰富虚拟世界的场景、实体和交互任务，推动具身AI在现实世界中的应用。

北师大具身AI的虚拟世界扩展！UNREALZOO：为具身智能打造高逼真度的虚拟世界

作者：Fangwei Zhong, Kui Wu, Churan Wang, Hao Chen, Hai Ci, Zhoujun Li, Yizhou Wang 单位：北京师范大学，北京航空航天大学，北京大学，BIGAI，澳门城市大学，新加坡国立大学论文标题&#xf…...

编程日记 2025/8/23 9:22:47

2025 年浙江保安员职业资格考试高效备考指南

浙江以创新活力著称，保安行业也在不断革新。2025 年考试报考条件常规，报名主要通过浙江省保安服务监管信息系统，方便快捷。理论考试在传统知识基础上，加大对智能安防技术应用的考查，如人脸识别系统、智能监控报警系…...

编程日记 2025/8/19 4:15:51

创意设计：动态彩色数学爱心

设计理念数学之美：使用心形线的数学方程（心形曲线）生成爱心形状。视觉吸引力：通过 Python 的 colorama 库添加颜色渐变效果。动态感：加入简单的动画，让爱心“跳动”。技术魅力：结合模块化编程…...

编程日记 2025/8/22 10:55:02

C++动态内存管理完全指南：从基础到现代最佳实践

一、动态内存基础原理 1.1 内存分配层次结构内存类型生命周期分配方式典型使用场景静态存储区程序整个运行期编译器分配全局变量、静态变量栈内存函数作用域自动分配/释放局部变量堆内存手动控制new/malloc分配动态数据结构 1.2 基本内存操作函数 // C风格 void* malloc(s…...

编程日记 2025/8/17 22:11:33

ebpf: CO-RE, BTF, and Libbpf（一）

本文内容主要来源于Learning eBPF，可阅读原文了解更全面的内容。概述一个ebpf程序可以在一个kernel版本中编译，而在另外一个kernel版本上运行，即便两个kernel版本中有些结构体有变化。而BTF(BPF Type Format) 是能让ebpf有这种强大兼容性…...

编程日记 2025/8/23 9:19:33

Linux 递归查找并删除目录下的文件

在 Linux 中，可以使用 find 命令递归查找并删除目录下的文件 1、示例命令 find /path/to/directory -type f -name "filename_pattern" -exec rm -f {} 2、参数说明 /path/to/directory：要查找的目标目录type f：表示查找文件&am…...

编程日记 2025/8/18 0:54:25

使用人工智能大模型腾讯元宝，如何快速编写活动记录？

今天我们学习使用人工智能大模型腾讯元宝，如何快速编写活动记录？ 手把手学习视频地址https://edu.csdn.net/learn/40402/666457 第一步在腾讯元宝对话框中输入如何协助老师写教研活动记录，通过提问，我们了解了老师写教研活动记录…...

编程日记 2025/8/19 4:15:35

File 类的用法和 InputStream, OutputStream 的用法

1 文件系统的操作创建文件，删除文件，创建目录，重命名文件，判定文件存在... Java中提供file类进行文件系统操作，使用路径进行初始化表示具体的文件（可以存在，也可以不存在）&#xf…...

编程日记 2025/8/23 9:19:35

buuctf--[湖南省赛2019]Findme

目录前沿解题过程分析 p1 P2 p3 p4 p5 前沿其实对于这道题呢，我的想法是不知道怎么判断的，这个题你说他难吧，他用的都是比较基础的东西，说他简单吧，他有太复杂的过程，总体来讲&#xff0…...

编程日记 2025/8/23 8:53:56

【从0到1学MybatisPlus】MybatisPlus入门

Mybatis-Plus 使用场景大家在日常开发中应该能发现，单表的CRUD功能代码重复度很高，也没有什么难度。而这部分代码量往往比较大，开发起来比较费时。因此，目前企业中都会使用一些组件来简化或省略单表的CRUD开发工作。目前在国…...

编程日记 2025/8/17 12:49:48

【S32M244 RTD200P04 LLD篇8】S32M244 PWM ADC LLD demo

【S32M244 RTD200P04 LLD篇8】S32M244 PWM ADC LLD demo 一，文档简介二，PWMTRGMUXPDBADC 2ch 软件配置与实现2.1 软硬件版本平台2.2 Demo CT 模块配置2.2.1 引脚配置2.2.2 时钟配置2.2.3 外设配置 2.3主程序调用情况三， 测试结果一&#xf…...

编程日记 2025/8/23 9:22:13

（蓝桥杯）动态规划蓝桥杯竞赛指南：动态规划解决最少钞票数问题（超详细解析+代码实现）

问题描述近期，黄开的银行新发行了一种面额为 4 的钞票，使得钞票种类增至 5 种：20、10、5、4 和 1 元。银行在发钞时十分“节俭”，当有客户取钱时，需要以最少的钞票数来满足取款金额。问题要求： 对于给定…...

编程日记 2025/8/17 15:55:17

深度：善用人工智能推动高等教育学习、教学与治理的深层变革

在人工智能技术与教育深度融合的当下，高等教育正经历着前所未有的范式转型。从学习方式的革新到教学模式的重构，再到治理体系的升级，人工智能已不再仅仅是辅助工具，而是成为重塑高等教育生态的核心驱动力。这一变革浪潮中，生成式人工智能（Generative AI）作为技术前沿的代…...

编程日记 2025/8/22 22:29:27

python全栈-JavaScript

python全栈-js 文章目录 js基础变量与常量JavaScript引入到HTML文件中JavaScript注释与常见输出方式数据类型typeof 显示数据类型算数运算符之加法运算符运算符之算术运算符运算符之赋值运算符运算符之比较运算符运算符之布尔运算符运算符之位运算符运算符优先级类型转换控制…...

编程日记 2025/8/23 9:22:46

Django信号使用完全指南示例

推荐超级课程：本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录 **引言：****先决条件：****目录：****1. 什么是Django信号？****2：设置你的Django项目****2.1. 安装Django**2.2. 创建一个Django项…...

编程日记 2025/8/17 21:11:58

# 深入理解GPT：架构、原理与应用示例

深入理解GPT：架构、原理与应用示例一、引言 GPT（Generative Pre-trained Transformer）系列模型自2018年问世以来，凭借其强大的文本生成能力和多任务适应性，彻底改变了自然语言处理（NLP）领域。…...

编程日记 2025/8/23 9:22:13

C语言递归

一、递归的核心原理 1. 递归的本质自相似性：将问题分解为与原问题结构相同但规模更小的子问题（如树的遍历、分治算法）。栈机制：每次递归调用都会在内存栈中创建一个新的函数栈帧，保存当前状态（参数、局…...

编程日记 2025/8/22 5:11:39

Jetpack Compose 基础组件学习2.0

文章目录 1、kotlin版本修改问题修改2、前言：参考知识点： 3、文字超链接的实现新版实现（Text AnnotatedString实现效果） 4、文字强调效果（ Material3 的透明度方案）material依赖实现文字强调效果&#xff…...

编程日记 2025/8/23 9:21:50

MySQL SQL 优化的10个关键方向

1. 索引优化合理创建索引：为高频查询条件、JOIN字段、排序字段创建索引复合索引设计：遵循最左前缀原则，将选择性高的列放在前面避免索引失效：防止索引列上使用函数、类型转换、OR条件不当使用覆盖索引：尽量让查…...

编程日记 2025/8/23 9:22:15

babel-runtime 如何缩小打包体积

🤖 作者简介：水煮白菜王，一位前端劝退师 👻 👀 文章专栏： 前端专栏 ，记录一下平时在博客写作中，总结出的一些开发技巧和知识归纳总结✍。感谢支持💕💕&#…...

编程日记 2025/8/23 9:20:03

VMware Fusion虚拟机Mac版安装CentOS Stream 9

VMware Fusion虚拟机Mac版安装CentOS Stream 9 文章目录 VMware Fusion虚拟机Mac版安装CentOS Stream 9一、介绍二、效果三、下载一、介绍 CentOS Stream 9是CentOS Stream发行版的最新主要版本，旨在提供Red Hat Enterprise Linux（RHEL）的每…...

编程日记 2025/8/23 9:22:15

手搓多模态-05 transformer编码层

前情回顾前面我们已经实现一个图像嵌入层和顶层的模型调度： class SiglipVisionTransformer(nn.Module): ##视觉模型的第二层，将模型的调用分为了图像嵌入模型和transformer编码器模型的调用def __init__(self, config:SiglipVisionConfig):super().__i…...

编程日记 2025/8/19 7:48:26

LightTrack + VOT2019 + Jetson 部署全流程指南【轻量级目标跟踪】

LightTrack VOT2019 Jetson 部署全流程指南【轻量级目标跟踪】 🔧 1. 环境准备（Jetson 平台）推荐配置：⚙️ 安装 Python 3.6 虚拟环境（Jetson 原生 Python 版本较新） 📥 2. 下载 LightTrack 源…...

编程日记 2025/8/22 4:09:47

【Easylive】视频删除方法详解：重点分析异步线程池使用

【Easylive】项目常见问题解答（自用&持续更新中…） 汇总版方法整体功能这个deleteVideo方法是一个综合性的视频删除操作，主要完成以下功能： 权限验证：检查视频是否存在及用户是否有权限删除核心数据删除&…...

编程日记 2025/8/23 9:22:15

（C语言）循环单链表（数据结构）（指针）（循环列表教程）

目录源代码： 代码详解： 1. 头文件和宏定义 2. 类型定义 3. 初始化链表 4. 判断链表是否为空 5. 求链表的长度 6. 清空链表 7. 销毁链表 8. 链表的插入（头插法） 9. 链表的插入（尾插法） 10. 查看…...

编程日记 2025/8/21 4:40:37

一、Debian 12系统准备 1.更新系统 #apt update && apt upgrade -y 2.安装基础工具 #apt install -y git curl wget make gcc 二、安装Go环境 Go语言的镜像官网：https://golang.google.cn/ 1.下载go最新版 #cd /usr/local/src #wget -o https://golang.go…...

编程日记 2025/8/18 0:24:51

淘宝商品评论API接口概述及JSON数据参考（测试）

前言一、淘宝商品评论API接口概述淘宝商品评论API接口是淘宝开放平台提供的一项服务，允许开发者通过HTTP请求获取指定商品的评论数据。这些数据包括评论内容、评论者信息、评分、评论时间等，为开发者提供了丰富的商品评价信息，有助于分析…...

编程日记 2025/8/23 9:21:47

AI：决策树、决策森林与随机森林

决策树与随机森林：从原理到实战的全面解析（2025最新版）引言在机器学习的世界里，决策树和森林模型（包括随机森林）常常是数据科学家们常用的工具之一。无论是初学者还是资深从业者，理解这些模型的原理和应用，都能帮助你在数据分析和预测任务中获得更好的结果。本文将…...

编程日记 2025/8/17 17:14:20

图形化编程语言：低代码赛道的技术革命与范式突破

在 2024 年 Gartner 低代码平台魔力象限报告中，传统低代码厂商市场份额增速放缓至 12%，而图形化编程语言赛道融资额同比激增 370%。本文深度剖析低代码平台的技术瓶颈，系统阐释图形化编程语言的核心优势，揭示其如何重构软件开发范…...

编程日记 2025/8/20 1:36:47

EdgeInfinite: 用3B模型处理无限长的上下文

论文标题 EdgeInfinite: A Memory-Efficient Infinite-Context Transformer for Edge Devices 论文地址 https://arxiv.org/pdf/2503.22196 作者背景 vivo，浙江大学代码 The code will be released after the official audit. 动机 self-attention的二次时…...

编程日记 2025/8/23 9:22:14

大模型论文：Improving Language Understanding by Generative Pre-Training

大模型论文：Improving Language Understanding by Generative Pre-Training OpenAI2018 文章地址：https://www.mikecaptain.com/resources/pdf/GPT-1.pdf 摘要自然语言理解包括各种各样的任务，如文本蕴涵、问题回答、语义相似性评估和文…...

编程日记 2025/8/19 21:34:39

springboot 项目怎样开启https服务

要在Spring Boot项目中启用HTTPS服务，请按照以下步骤操作： 1. 生成SSL证书密钥库使用keytool生成自签名证书在终端或命令行工具中运行以下命令，生成一个PKCS12格式的密钥库文件： keytool -genkeypair -alias myapp -keyalg …...

编程日记 2025/8/22 10:02:12

R语言之mlr依赖包缺失警告之分析

因为本地没有网络，所有相关的依赖包都是手动下载，再使用脚本一键安装的。在使用mlr包时，执行下面的代码时，总是报各种依赖缺失，也不知道咋看FAIL信息。 # 建模与调参 # 查阅线性回归、随机森林、xgboost和KNN四种模…...

编程日记 2025/8/18 16:33:05

如何记录日常笔记

关于用Obsidian记日常笔记这事儿，我的经验是别想得太复杂。刚开始用的时候总想着要搞个完美的分类系统，后来发现简单粗暴反而最实用。文件夹分两类就够了——比如「工作记录」扔一个文件夹，「读书笔记」扔另一个，别分太细&#…...

编程日记 2025/8/23 9:21:49

Completablefuture的底层原理是什么

参考面试回答： 个人理解 CompletableFuture 是 Java 8 引入的一个类、它可以让我们在多线程环境中更加容易地处理异步任务。CompletableFuture 的底层原理是基于一个名为 FutureTask 的机制、结合了监听器模式和等待-通知机制来处理异步计算。 1.首先就是Com…...

编程日记 2025/8/19 17:49:05

Linux学习笔记（1）目录结构与路径描述：对比 Windows 系统差异（期末，期中复习笔记全）

前言一、Linux 的目录结构二、Linux 路径的描述方式三、总结前言在计算机操作系统的领域中，Linux 和 Windows 是两大主流系统。它们在目录结构和路径描述方式上存在显著不同，理解这些差异对于熟练掌握 Linux 系统至关重要。一、Linux 的目录结构…...

编程日记 2025/8/20 12:00:49

《算法笔记》10.3小节——图算法专题-＞图的遍历问题 A: 第一题

题目描述该题的目的是要你统计图的连通分支数。输入每个输入文件包含若干行，每行两个整数i,j，表示节点i和j之间存在一条边。输出输出每个图的联通分支数。样例输入 1 4 4 3 5 5样例输出 2 分析： 由于题目没给出范围&#xff0…...

编程日记 2025/8/20 1:26:04

【docker】

1.构建jar包 2.构建自定义的镜像dockerfile vim Dockerfile # 使用 OpenJDK 17 作为基础镜像，该镜像包含 JDK 17 环境 # 该镜像适用于需要编译或运行基于 JDK 17 的 Java 应用程序FROM openjdk:8-jdk-alpine# 设置容器中的工作目录为 /app # 所有后续操作&#xf…...

编程日记 2025/8/20 21:45:53

深度学习总结（1）

初识神经网络（helloworld）要解决的问题是，将手写数字的灰度图像（28像素28像素）划分到10个类别中（从0到9）。我们将使用MNIST数据集。在机器学习中，分类问题中的某个类别叫作类（class），数据点叫作样本（sample），与某个样本对应的类叫作标签（label）。…...

编程日记 2025/8/18 1:10:49

Java面试38-Dubbo是如何动态感知服务下线的？

首先，Dubbo默认采用Zookeeper实现服务注册与服务发现，就是多个Dubbo服务之间的通信地址，是使用Zookeeper来维护的。在Zookeeper上，会采用树形结构的方式来维护Dubbo服务提供端的协议地址，Dubbo服务消费端会从Zookeeper…...

编程日记 2025/8/18 1:02:39

企业数据分析何时该放弃Excel？

在企业数据分析中，Excel 的适用数据量范围取决于数据复杂度、计算需求和硬件性能：一、Excel 适合处理的数据量范围数据规模适用场景限制与风险≤10万行- 日常报表 - 简单数据透视表 - 基础公式计算（如SUMIFS、VLOOKUP）处理流畅，无明显性能问题10万~50万行- 较复杂分析…...

编程日记 2025/8/21 4:37:21

单片机实现触摸按钮执行自定义任务组件

触摸按钮执行自定义任务组件项目简介本项目基于RT8H8K001开发板 RT6809CNN01开发板 TFT显示屏(1024x600) GT911触摸屏实现了一个多功能触摸按钮组件。系统具备按钮控制后执行任务的功能，可用于各类触摸屏人机交互场景。硬件平台 MCU: STC8H8K64U&#xff0…...

编程日记 2025/8/19 12:19:09

深度学习与神经网络 | 邱锡鹏 | 第四章学习笔记神经网络

四、神经网络文章目录四、神经网络4.1 神经元4.2 神经网络4.3 前馈神经网络4.4 反向传播算法4.5 计算图与自动微分4.6 优化问题 4.1 神经元 w表示每一维（其他神经元）的权重，b可以用来调控阈值，z 经过激活函数得到最后的值a来判…...

编程日记 2025/8/22 16:54:43

去产能、去库存、去杠杆、降成本、补短板的智慧工业开源了。

智慧工业视觉监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。用户只需在界面上…...

编程日记 2025/8/18 1:09:14

【嵌入式系统设计师】知识点：第4章嵌入式系统软件基础知识

提示：“软考通关秘籍” 专栏围绕软考展开，全面涵盖了如嵌入式系统设计师、数据库系统工程师、信息系统管理工程师等多个软考方向的知识点。从计算机体系结构、存储系统等基础知识，到程序语言概述、算法、数据库技术（包括关系数据库、非关系型数据库、SQL 语言、数据仓库等）…...

编程日记 2025/8/21 2:15:39

Scala基础知识

数组不可变数组第一种方式定义数组定义：val arr1 new Array[Int](10) （1）new 是关键字 （2）[Int]是指定可以存放的数据类型，如果希望存放任意数据类型，则指定Any （3&#x…...

编程日记 2025/8/17 23:10:48

scala课后总结（7）

不可变数组与可变数组的转换 arr1.toBuffer ：将不可变数组 arr1 转换为可变数组，原 arr1 不变，返回新的可变数组。 arr2.toArray ：把可变数组 arr2 转为不可变数组， arr2 本身不变，返回新的不可…...

编程日记 2025/8/21 22:27:44

【T2I】MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis

code：CVPR 2024 MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis [CVPR 2024] MIGC: Multi-Instance Generation Controller for Text-to-Image Synthesis - 知乎 Abstract 我们提出了一个多实例生成(Multi-Instance Generation, MIG)任务…...

编程日记 2025/8/22 7:52:14

MyBatis的第三天笔记

4. MyBatis核心配置文件详解 4.1 配置文件结构 MyBatis核心配置文件采用XML格式，主要用于配置数据库连接、事务管理、映射文件等信息。以下是一个基本的配置文件示例： <?xml version"1.0" encoding"UTF-8" ?> <!DOCTY…...

编程日记 2025/8/22 7:47:42

03_docker 部署 nginx 配置 HTTPS 并转发请求到后端服务

03_Docker 部署 Nginx 配置 HTTPS 并转发请求到后端服务一、在 Docker 内部署 Nginx 拉取 Nginx 镜像 docker pull nginx:1.19.4 //如果能直接拉取使用这个命令 docker pull docker.xuanyuan.me/nginx:1.19.4 //不能直接拉取需要在前面加上镜像地址拉取成功后，创建…...

编程日记 2025/8/21 23:00:25

主要贡献

研究背景

研究问题

研究难点

相关工作

现实模拟器用于具身智能

具身视觉智能体

UnrealZoo

环境合集

场景来源与构建

场景标签与分类

场景集成

可控实体

实体类型

功能与控制

视觉数据采集

编程接口

UnrealCV+

OpenAI Gym接口

实验

视觉导航

实验设置

基线方法

结果

主动视觉跟踪

环境选择

评估指标

基线方法

结果分析

社会跟踪

动态干扰下的鲁棒性

跨实体泛化

控制频率的影响

总结

相关文章：