PIXOR:基于LiDAR的3D检测模型解析
目录
1、前言
2、PIXOR介绍
2.1. 什么是PIXOR?
2.2. PIXOR如何工作?
3、表现和应用
3.1、PIXOR的性能表现
3.2、PIXOR的应用场景
3.3、PIXOR的局限性与挑战
4. PIXOR的未来展望
5. 结语
1、前言
自动驾驶技术正以前所未有的速度发展,而PIXOR(Oriented 3D Object Detection from PIXel-wise neural network predictions)作为一种基于LiDAR的3D目标检测模型,曾在2018年引起广泛关注。本文将深入解析PIXOR的工作原理、性能表现及其在自动驾驶中的应用,同时直面其局限性与挑战。
2、PIXOR介绍
2.1. 什么是PIXOR?
PIXOR是一种专为自动驾驶设计的3D目标检测模型,旨在从LiDAR点云数据中实时检测车辆、行人等物体。它通过将杂乱的3D点云转换为鸟瞰图(Bird’s Eye View,BEV),并利用全卷积神经网络进行检测,输出带有方向的3D边界框。PIXOR的优势在于其简洁的单阶段设计和较高的检测速度,但其性能在远距离和复杂场景下仍存在不足。
2.2. PIXOR如何工作?
PIXOR的工作流程可分为以下几个关键步骤:
- 点云转鸟瞰图(BEV)
PIXOR将LiDAR点云投影到二维网格上,生成BEV表示。每个网格记录占用率(是否有物体)和反射强度。例如,在KITTI数据集中,PIXOR使用800x700的网格,叠加36个通道(高度和反射率)。
局限性:点云稀疏性导致远距离物体信息不足,高度压缩也丢失了部分三维特征,影响检测精度。 - 全卷积神经网络
PIXOR采用基于ResNet的Backbone网络提取特征,Header网络进行分类和回归预测。Header网络输出1个分类通道(置信度)和6个回归通道(边界框参数)。
局限性:小目标和遮挡物体检测效果不佳,网络对远距离物体的特征提取能力有限。 - 输出定向3D边界框
PIXOR为每个检测到的物体生成带有方向的3D边界框,包含中心位置、尺寸和朝向。
局限性:在远距离或点云稀疏区域,边界框定位精度下降,易产生误检。

3、表现和应用
3.1、PIXOR的性能表现
PIXOR在KITTI和TOR4D数据集上表现出色,但需注意其历史背景和评测细节:
- KITTI数据集(2012年)
PIXOR在0.7 IoU下的平均精度(AP)为75.74%,优于当时的MV3D(65.31%),且检测速度为35ms(GTX 1080Ti,1024×1024输入)。
局限性:KITTI数据主要来自德国郊区,无法代表现代城市复杂场景,且PIXOR在远距离(>50m)检测精度显著下降。 - TOR4D数据集
PIXOR在TOR4D上的AP为73.3%,展示了跨数据集的泛化能力。
局限性:TOR4D评测标准与KITTI不完全对齐,类别不平衡和难易样本分布可能影响AP的可比性。 - 与现代模型的对比
PIXOR(2018年)在当时领先,但相较于2023年的SOTA模型(如BEVFormer、CenterPoint),其在小目标和遮挡场景下的表现已落后。
建议:承认PIXOR的历史地位,但强调其在现代自动驾驶技术栈中的局限性。
3.2、PIXOR的应用场景
PIXOR在自动驾驶和机器人领域有潜在应用,但需注意其适用条件:
- 自动驾驶汽车
PIXOR可用于实时检测周围车辆和行人,但35ms的延迟在高速场景下可能不足,远距漏检率(>20%)也影响安全性。
建议:PIXOR更适合低速或测试场景,量产车需结合多传感器融合提升鲁棒性。 - 机器人导航
在室内或遮挡较少的室外环境,PIXOR可辅助机器人避障,但LiDAR在多反射表面(如玻璃)下易失效。
建议:结合超声波或摄像头优化室内应用。
3.3、PIXOR的局限性与挑战
PIXOR在实际应用中面临以下挑战:
- 远距离检测困难
点云稀疏导致远距离物体信息不足,PIXOR在50m以上检测精度急剧下降,易产生误检和漏检。 - 复杂场景下的遮挡问题
在拥挤或多物体遮挡场景中,PIXOR难以准确分割和定位重叠目标,影响检测完整性。 - 硬件依赖与部署成本
PIXOR依赖高性能GPU(如GTX 1080Ti),在车载嵌入式系统上的实时性难以保证,部署成本高昂。
4. PIXOR的未来展望
PIXOR的未来发展需直面技术瓶颈,以下是一些可行方向:
- 多传感器融合
结合摄像头或雷达,弥补LiDAR在远距离和恶劣天气下的不足。PIXOR可借鉴PointFusion等方案,优化融合策略。 - 神经网络优化
引入Transformer架构(如BEVFormer的注意力机制),提升对小目标和遮挡物体的检测能力,并探索轻量化设计以适应边缘计算。 - 数据增强与自监督学习
通过补点技术或自监督学习,缓解点云稀疏性问题,提升模型在远距离场景下的鲁棒性。
5. 结语
PIXOR作为2018年的创新之作,展示了BEV视角在3D检测中的潜力,但其在远距离、遮挡场景和嵌入式部署上的局限性已让它落后于时代。自动驾驶的未来需要更全面、更可靠的感知方案,而PIXOR的“鹰眼”光环,终将被技术演进的洪流所冲刷。作者建议读者在评估自动驾驶技术时,警惕数据崇拜和应用夸大,关注算法在真实场景中的表现与挑战。
相关文章:
PIXOR:基于LiDAR的3D检测模型解析
目录 1、前言 2、PIXOR介绍 2.1. 什么是PIXOR? 2.2. PIXOR如何工作? 3、表现和应用 3.1、PIXOR的性能表现 3.2、PIXOR的应用场景 3.3、PIXOR的局限性与挑战 4. PIXOR的未来展望 5. 结语 1、前言 自动驾驶技术正以前所未有的速度发展ÿ…...
【OSG学习笔记】Day 2: 场景图(Scene Graph)的核心概念
今天课程分为两部分,第一部分我们学习一下Scene Graph理论知识,第二部分我们熟悉下OSG的源码。 第一部分(Scene Graph) 在OpenSceneGraph中,场景图(Scene Graph)通过树状层级结构高效管理3D对…...
虚幻5的C++调试踩坑
本地调试VS附加调试 踩坑1 预编译版本的UE5没有符号文件,无法调试源码 官方代码调试所需要的符号文件bdp需要下载导入。我安装的5.5.4是预编译版本,并非ue5源码。所以不含bdp文件。需要调试官方代码则需要通过EPIC中下载安装。右键UE版本,打…...
【软件测试】自动化测试框架Pytest + Selenium的使用
Pytest Selenium 是一种常见的自动化测试框架组合,用于编写和执行 Web 应用程序的自动化测试。Pytest 是一个强大的 Python 测试框架,而 Selenium 是一个用于浏览器自动化的工具,二者结合使用可以高效地进行 Web 应用的功能测试、UI 测试等。…...
蓝桥杯补题
方法技巧: 1.进行循环暴力骗分,然后每一层的初始进行判断,如果已经不满足题意了,那么久直接continue,后面的循环就不用浪费时间了。我们可以把题目所给的等式,比如说有四个未知量,那么我们可以用…...
2025年港口危货储存单位主要安全管理人员备考练习题
港口危货储存单位主要安全管理人员备考练习题: 单选题 1、依据《安全生产法》,危险物品的生产、储存单位的安全生产管理人员的任免,应当告知( )。 A. 主管的负有安全生产监督管理职责的部门 B. 当地人民政府 C. 行…...
openEuler欧拉系统配置local的yum源
1.下载iso openEuler | 开源社区 | openEuler社区官网 2.上传openEuler镜像文件至服务器(例如上传至/home目录) 3.创建挂载目录 #mkdir -p /mount/iso 4.镜像挂载 #mount -o loop /home/openEuler-22.03-LTS-x86_64-dvd.iso(镜像上传目…...
AI比人脑更强,因为被植入思维模型【52】福格行为模型
giszz的理解:重要公式,是BMAT,行为动机能力触发点。也许是乘以。这个挺深刻的,在产品设计中,界面交互,都可以用到这样的思维模型。 一、定义 福格行为模型(Fogg Behavior Model)是由…...
DocLayout-YOLO:通过多样化合成数据与全局-局部感知实现文档布局分析突破
论文地址:https://arxiv.org/pdf/2410.12628 目录 一、论文概览:当YOLO遇见文档分析 二、创新点解析:两大核心技术 创新点1:Mesh-candidate BestFit合成算法 创新点2:全局-局部可控感知模块(GL-CRM) 三、实验结果:全面超越SOTA 主要指标对比(D4LA数据集) 消融…...
栈(算法)
在 C 里,栈是一种遵循后进先出(LIFO)原则的数据结构。下面从多个方面为你介绍 C 栈: 1. 使用标准库中的std::stack C 标准库提供了std::stack容器适配器,能方便地实现栈的功能。以下是简单示例: cpp #in…...
leetcode每日一题:子数组异或查询
引言 今天的每日一题原题是3375. 使数组的值全部为 K 的最少操作次数,比较水,可以分成2种情况: 存在比k更小的数,由于每次操作只能使得部分数变小,但是不能把任何数变大,所以肯定无法达成 不存在比k更小的…...
openEuler-22.03-LTS-SP3-x86_64 离线编译安装 nginx 1.20.1
openEuler-22.03-LTS-SP3-x86_64 离线编译安装 nginx 1.20.1 一、概述二、安装依赖1、安装 pcre、pcre-devel2、安装 zlib、zlib-devel3、安装 make、gcc、gcc-c3、编译 openssl5、安装 libtool6、编译 pcre-8.45 三、下载编译 nginx四、运行 nginx 一、概述 本文档适用于无法…...
使用Alamofire下载网站首页内容
用Alamofire库写一个下载网站首页内容的Swift代码。首先,我需要确认用户的需求。他们可能是在开发一个iOS应用,需要从某个网站获取首页的数据,比如HTML内容或者API数据。Alamofire是一个常用的Swift网络库,基于URLSession…...
服务器DNS失效
服务器异常 xx.t.RequestException: java.net.UnknownHostException: test.ac.xxxx.cn现象分析 本地测试正常,说明域名本身无问题。服务器 DNS 解析异常,导致 UnknownHostException。**服务器可正常解析 ****baidu.com**,说明网络正常&#…...
#无类域间路由(快速复习版)
判断两个无类(CIDR)地址是否属于同一个子网 🎯 问题本质: 判断两个 IP 地址是否属于同一个子网,其实就是 对比它们的“网络地址”是否相同。 🔍 原理步骤(通用方法) 我们按步骤来判…...
【Linux】jumpserver开源堡垒机部署
JumpServer 安装部署指南 本文档详细记录了 JumpServer 安装部署的过程、核心脚本功能说明以及后续管理使用提示,方便运维人员快速查阅和二次安装。 1. 前提条件 操作系统要求: 仅支持 Linux 系统,不支持 Darwin(macOS࿰…...
Memcached缓存系统:从部署到实战应用指南
#作者:猎人 文章目录 一、安装libevent二、安装配置memcached三、安装Memcache的PHP扩展四、使用libmemcached的客户端工具五、Nginx整合memcached:六、php将会话保存至memcached Memcached是一款开源、高性能、分布式内存对象缓存系统,可应用各种需要缓…...
【rdma tx data flow问题】
rdma data flow问题 1 SQ_doorbell如何产生? --RDMA网卡doorbell寄存器触发;2 CPU如何访问网卡的Doorbell寄存器?3 为什么需要roce_qid_convert把local_qid转换成global_qid;4.WQE的format是什么?5.WQE在网卡硬件中的处理流程&…...
Vue 框架组件间通信方式
组件间通信方式 不管是 vue2 还是 vue3,组件通信方式很重要,以下是常见的几种通信方式: props:可以实现父子组件、子父组件、甚至兄弟组件通信自定义事件:可以实现子父组件通信全局事件总线 $bus:可以实现…...
React 第三十节 使用 useState 和 useEffect Hook实现购物车
不使用 redux 实现 购物车案例 使用 React 自带的 useState 和 useEffect Hook 即可实现购物车 export default function ShoppingCar() {// 要结算的商品 总数 以及总价const [totalNum, setTotalNum] useState(0)const [totalPerice, setTotalPerice] useState(0)// 商品…...
卷积神经网络CNN
目录 一、图像基础知识 图像基本概念 图像的加载 二、CNN概述 CNN概述 三、卷积层 卷积计算 Padding Stride 多通道卷积计算 PyTorch卷积层API 四、池化层 池化层计算 Stride Padding 多通道池化层计算 PyTorch 池化 API 五、图像分类案例 CIFAR10 数据集 …...
【大数据生态】Hive的metadata服务未开启
解决办法 进入到Hive的bin目录下,键入命令: #启动元服务 [atguiguhadoop102 bin]$ pwd /opt/module/hive-3.1.2/bin [atguiguhadoop102 bin]$ ./hive --service metastore & #启动hive [atguiguhadoop102 hive-3.1.2]$ pwd /opt/module/hive-3.1.2 [atguiguhadoop102 hiv…...
【RabbitMQ】死信队列
1.概述 死信,顾名思义就是无法被消费的消息,也就是没有被传到消费者的消息,或者即使传到了也没有被消费。当然有死信就有死信队列。死信队列就是用来存储死信的。 它的应用场景就是保证订单业务的消息数据不丢失,当消息消费发 生…...
区间 dp 系列 题解
1.洛谷 P4342 IOI1998 Polygon 我的博客 2.洛谷 P4290 HAOI2008 玩具取名 题意 某人有一套玩具,并想法给玩具命名。首先他选择 W, I, N, G 四个字母中的任意一个字母作为玩具的基本名字。然后他会根据自己的喜好,将名字中任意一个字母用 W, I, N, G …...
Typora使用笔记
文章目录 主题自动编号字体设置两端对齐Step1Step 2 代码块显示行号设置快捷键参考文献 主题自动编号 typora-theme-auto-numbering 字体设置两端对齐 Step1 切记从typora的偏好设置中打开主题所在的文件夹,并修改对应的css文件。(以 github.css 为例…...
k8s部署grafana
先决条件 这里部署过程的前提是已经部署好storageclass,所以pv会根据pvc自动创建. 详情参考:k8s-StoargClass的使用-基于nfs_a volume that contains injected data from multiple-CSDN博客 直接开始: 部署pvc [rootmodule /zpf/grafana]$cat pvc.yml apiVersion: v1 kind…...
第三章:SQL 高级功能与性能优化
1. 窗口函数(Window Functions) 用于在结果集的“窗口”(指定行范围)内执行计算,保留原数据行的同时生成聚合或排序结果。 1.1 核心语法 SELECT column1,column2,[窗口函数] OVER (PARTITION BY 分组列…...
[ACM_3] n组数据 | getchar() | getline(cin,s)
目录 14. 第⼀⾏是⼀个整数n,表示⼀共有n组测试数据, 之后输⼊n⾏ 字符串 15. 第⼀⾏是⼀个整数n,然后是n组数据,每组数据2⾏,每⾏ 为⼀个字符串,为每组数据输出⼀个字符串,每组输出占⼀⾏ 16. 多组测试…...
富士相机照片 RAF 格式如何快速批量转为 JPG 格式教程
富士(Fujifilm)相机拍摄的 RAW 格式文件(RAF)因其高质量和丰富的图像信息而受到摄影师的喜爱。然而,RAF 文件通常体积较大且不易于分享或直接使用。为了方便处理,许多人选择将其转换为更通用的 JPG 格式。在…...
[特殊字符]【高并发实战】Java Socket + 线程池实现高性能文件上传服务器(附完整源码)[特殊字符]
大家好!今天给大家分享一个 Java Socket 线程池 实现的高性能文件上传服务器,支持 多客户端并发上传,代码可直接运行,适合 面试、项目实战、性能优化 学习! 📌 本文亮点: ✅ 完整可运行代码&a…...
2025 年天津消防设施操作员考试攻略:深挖地区特色考点
天津作为重要的港口城市与工业基地,消防安全形势复杂多样,其消防设施操作员考试也带有鲜明的地区特色。 地区特色考点解析:天津化工产业发达,涉及众多危化品场所。因此,危化品储存场所的消防设施配置与应急处置成为…...
chrome extension开发框架WXT之Browser.runtime
以下是对 Browser.runtime API 中主要方法的参数、返回值、作用及运用场景的详细解释: 1. 连接与通信方法 connect(connectInfo?: ConnectInfo) / connect(extensionId: string, connectInfo?: ConnectInfo) 参数: extensionId(可选):目标扩展的 ID,未指定时默认连接当…...
dav_1_MySQL数据库排查cpu消耗高的sql
CPU消耗高sql定位 以下从2个维度进行分析,一个是当前cpu高占用排查,一个是历史sql占用高排查 一.当前cpu占用高排查 1 从os资源消耗逐步到mysql查询 1.1 输入top 然后按大P 使之进程按照消耗cpu排序 比如3889为mysql进程ID,接下来再用它查…...
数据结构刷题之贪心算法
贪心算法(Greedy Algorithm) 是一种在每个步骤中都选择当前最优解的算法设计策略。它通常用于解决优化问题,例如最小化成本或最大化收益。贪心算法的核心思想是:在每一步选择中,都做出局部最优的选择,希望…...
每日一题(小白)暴力娱乐篇23
由题意得知给我们一串数字,我们每次交换两位,最少交换多少次成功得到有顺序的数组。我们以平常的思维去思考,加入给你一串数字获得最少的交换次数,意味着你的交换后续基本不会变,比如说2 1 3 5 4 中1与2交换后不变&…...
回归预测 | Matlab实现RIME-CNN-GRU-Attention霜冰优化卷积门控循环单元注意力机制多变量回归预测
回归预测 | Matlab实现RIME-CNN-GRU-Attention霜冰优化卷积门控循环单元注意力机制多变量回归预测 目录 回归预测 | Matlab实现RIME-CNN-GRU-Attention霜冰优化卷积门控循环单元注意力机制多变量回归预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.Matlab实现RIME…...
第1章 对大型语言模型的介绍
人类正处在一个关键转折点。自2012年起,基于深度神经网络的人工智能系统研发进入快速通道,将这一技术推向了新高度:至2019年底,首个能够撰写与人类文章真假难辨的软件系统问世,这个名为GPT-2(生成型预训练变…...
PGA 简介
PGA(Programmable Gain Amplifier,可编程增益放大器)是一种可以通过外部控制信号改变增益大小的放大器,常用于需要灵活调节信号放大倍数的应用中,比如在模拟信号采集、数据转换(如 ADC 之前)、传…...
2025年CCF-C NCA:导航变量多目标粒子群算法NMOPSO,深度解析+性能实测
目录 1.摘要2.运动学模型和约束3.路径规划目标函数3.多目标粒子群算法4.结果展示5.参考文献6.代码获取 1.摘要 路径规划是无人机(UAV)任务执行的核心,因为它决定了无人机完成任务所需的飞行路径。为了解决这一问题,本文提出了一种…...
FFMpeg音视频解码实战
音频解码 一、初始化阶段 avformat_open_input 打开输入媒体文件。avformat_find_stream_info 读取媒体流信息,查找音频流。avcodec_find_decoder 查找对应的解码器(如 AAC、MP3 解码器)。avcodec_alloc_context3 分配解码器上下文。avcodec…...
day25学习Pandas库
文章目录 三、Pandas库4.函数计算7.合并8.随机抽样9.空值处理9.1检测空值9.2填充空值9.3删除空值行/列 5.读取CSV文件5.1 to_csv()5.2 read_csv() 6.绘图 三、Pandas库 4.函数计算 7.合并 merge 函数用于将两个 DataFrame 对象根据一个或多个键进行合并 函数: …...
去除Mysql表中的空格、回车、换行符和特殊字符
系列文章目录 文章目录 系列文章目录前言一、示例1.sql层面2.java层面 前言 一、示例 1.sql层面 参考 ## 例子1 ## CHAR(10) 表示换行符 ## CHAR(13) 表示回车UPDATE 表名 SET 列名 REPLACE(REPLACE(列名, CHAR(10), ), CHAR(13), )## 例子2 ## 删除字段中的空格、换行符、…...
以普通用户身份启动pure-ftpd服务端
Pureftp的优点包括 : 高性能,适用于大容量数据传输。安全性强,通过SSL/TLS加密和身份验证机制保证文件传输安全。易用性高,具有直观的用户界面。灵活性强,支持多种文件存储方式。没有漏洞,便于维护 基于Centos 9的pu…...
国内下载不了镜像,可以用国外机器下载完成,打成tar文件,在国内机器上重新加载
可以在 已经拉取过镜像的机器上打包(导出)镜像文件,然后 拷贝到另一台机器上导入使用。这是离线部署 Docker 镜像的常用方法,非常适合网络受限的环境。 🛠️ 步骤如下: ✅ 1. 在已有镜像的机器上打包镜像 …...
【Java】Java 中不同类型的类详解
目录 Java 中不同类型的类详解一、基础类类型1. 普通类(Concrete Class)2. 抽象类(Abstract Class)3. 接口(Interface)4. 枚举类(Enum Class) 二、嵌套类与特殊类5. 内部类ÿ…...
Cadence学习笔记之---热风焊盘制作
目录 01 | 前 言 02 | 环境描述 03 | 热风焊盘 04 | 规则热风焊盘制作 05 | 不规则热风焊盘制作 06 | 总 结 01 | 前 言 在上一篇Cadence小记中讲述了如何制作贴片(SMD)焊盘、通孔焊盘、以及过孔;本篇关于Cadence的小记主要讲如何制作热风焊盘。 上篇小记&a…...
518. Coin Change II
这是完全背包问题。 由于求的是组合数,所以外层循环只能是对硬币遍历,内层循环只能是对总金额的遍历。 另外,虽然题目数据保证结果符合 32 位带符号整数。但是第28个测试用例,dp[j]dp[j-conis[i]]中间结果会整数溢出,…...
GPIO子系统与Pinctrl子系统的交互
我们前面呢,已经讲过GPIO子系统的数据结构以及他的设备树信息是怎么转换成我们的C代码存储在结构体里面了,我们知道,如果想去使用一个GPIO,避免不了得把这个引脚复用成GPIO功能,那么就避不开Pinctrl子系统,…...
DeepSeek实用操作及行业应用系列2
DeepSeek的本地化部署与AI通识教育之未来 DeepSeek之火,可以燎原 面向审计行业DeepSeek大模型操作指南v1.0 DeepSeek提示词设计、幻觉避免与应用(大数据百家讲坛) DeepSeek 搞钱教程(0基础入门) DeepSeek基础知识…...
面向数据库场景的大模型交互微调数据集
关键要点 研究表明,面向数据库场景的大模型交互微调数据集通常包括数据库模式、自然语言查询和对应的SQL查询。证据倾向于认为,数据集应以JSON格式组织,覆盖多种查询类型,并确保高质量和多样性。对于自定义数据库,建议…...