当前位置：首页 > news >正文

Ocean: Object-aware Anchor-free Tracking

news 来源：原创 2025/8/3 15:00:39

领域：Object tracking
It aims to infer the location of an arbitrary target in a video sequence, given only its location in the first frame

问题/现象：

Anchor-based Siamese trackers have achieved remarkable advancements in accuracy, yet the further improvement is restricted by the lagged tracking robustness.
即Anchor-based Siamese trackers精确度还行但鲁棒性不行
In prior Siamese tracking approaches, the classification confidence is estimated by the feature sampled from a fixed regular region in the feature map. This sampled feature depicts a fixed local region of the image, and it is not scalable to the change of object scale. As a result, the classification confidence is not reliable in distinguishing the target object from complex background.
分类置信度是通过从固定的局部区域得到的特征估计出来的，所以当物体尺度变化的时候它并不会改变。所以当要从复杂的背景区分目标物体时，这个分类器是不可靠的。
regression network in anchor-based methods is only trained on the positive anchor boxes. This mechanism makes it difficult to refine the anchors whose overlap with the target objects are small.

This will cause tracking failures especially when the classification results are not reliable. The regression network is incapable of rectifying this weak prediction because it is previously unseen in the training set.

原因是因为anchor-based methods的回归网络仅在正样本（当框和目标物体的重合超过一个标准时，称这个框为正样本）上训练（训练集中只有分类正确的时候，offset是什么。没有分类错误的样本）。这使得它很难去refine anchors当anchor和目标物体的重叠很少时（因为这个时候的框为负样本，previously unseen in the training set.，先前/训练时没见过这样的）。也就是当前面分类错误的时候，后面的回归网络也没有修正这个不准确的预测的能力

can we design a bounding-box regressor with the capability of rectifying inaccurate predictions?

YES!
在这里插入图片描述

这篇文章提出的跟踪器哈哈：Object-aware Anchor-Free Networks(Ocean)
(对应上述问题123)

consists of two components: an object-aware classification network and a bounding-box regression network.(anchor free的)
The classification is in charge of determining whether a region belongs to foreground or background
分类器分出前景和背景（分类只采样距离中心近的点为正样本）(同时使用了object-aware feature和regular-region feature。与之前anchor free方法，如FCOS不同的是增加了一个object-aware feature，且FCOS分类和回归都是计算所有落在GT内的点；)
introduce a feature alignment module to learn an object-aware feature from predicted bounding boxes. The object-aware feature can further contribute to the classification of target objects and background.
同时引进一个特征对齐的模块来学习 object-aware feature，使得更好的实现背景和目标物体之间的区分，也获得了一个全局的外观描述。
实现：将卷积核的固定采样位置对齐到预测的回归box（图2c）。回归box是通过bounding-box regression network得来的哦。对于classification map上的每个位置(dx, dy)，都有一个对应的回归预测框M=(mx, my, mw, mh)，mx, my表示中心，mw, mh表示宽高。目标就是从候选框M中采样特征来预测(dx, dy)的分类得分。
regression aims to predict the distances from each pixel within the target objects to the four sides of the groundtruth bounding boxes.
回归用来预测目标物体中的每个像素点到真实锚框的四条边的距离。(训练时候的样本是all the pixels in the groundtruth bounding box)

Since each pixel in the groundtruth box is well trained, the regression network is able to localize the target object even when only a small region is identified as the foreground.
就算只有很小一块区域被分类为前景，由于each pixel in the groundtruth box is well trained，所以该回归有修正前面不太正确的预测的可能性

(这样理解：anchor-based一个框是一个样本，这里一个像素是一个样本。前面的训练集是正确的框怎么偏移到groundtruth，后面的是每个像素到框的距离。那么当框和目标物体重叠很小但被预测为正确的框的时候。对于anchor-based，因为实际上它是负样本，所以没见过，没训练过。但对于anchor free的，即使预测为前景实际也为前景的部分很小，那也还是有实际为前景且被正确预测为前进的像素点存在的，训练的时候见过，所以有纠正预测的可能)

在这里插入图片描述

回归的时候所有位于groundtruth box内的像素都被标注为正样本
对于Regular-region classification，靠近目标中心点的一小部分区域内的像素为正样本
对于Object-aware classification，the IoU of predicted box and groundtruth box被用作标签。

more details are provided in this paper:Ocean: Object-aware Anchor-free Tracking

补充（超简版）：

anchor-based methodsVSanchor free methods
- anchor-based :
  - 相比于anchor free，它使用预定义的anchor框来匹配真实的目标框
  - 过程：生成 anchor boxes，判断每个 anchor box 为 foreground还是background（二分类），对anchor box进行微调（这部分就是前文提到的refine），使得 positive anchor 和真实框(Ground Truth Box)更加接近（使用regression ）
- anchor free:
  - Different from anchor-based methods which estimate the offsets of anchor boxes, anchor-free mechanisms predict the location of objects in a direct way.
  - 基于角点的/中心点的/全卷积的
目标跟踪VS目标检测
- 目标检测是事先针对特定目标的，比如人头检测、动物检测，目标跟踪则是对于任意目标的跟踪，即事先是不知道跟踪的具体目标的。（但是检测器也可以根据人们需要检测的目标进行初始化，这样好像又有点像跟踪器了->基于检测的目标跟踪。而且感觉基于检测的的目标跟踪有点杀鸡用牛刀了吧，因为根本不需进行目标识别，不需要每一帧都去检测，就只是目标跟踪就好了）
- 理想的跟踪器应该不需要每一帧都暴力检测目标所在的位置，而是可以充分利用帧间信息，目标周围的环境信息，甚至根据周边环境推测得到的三维信息等，更加高效的确定目标所在的位置
- 再想象一个场景：一个被设计用来检测行人的目标检测器，如果将其应用到马路场景上，检测器将会检测到马路上的大量行人。如果只想跟踪某个行人，那么检测器的结果并不是人们想要的。但这时跟踪器就完全不一样了，给跟踪器指定初始跟踪行人后，它将可以在后续的过程中只跟踪指定的行人

Ocean: Object-aware Anchor-free Tracking

领域：Object tracking It aims to infer the location of an arbitrary target in a video sequence, given only its location in the first frame 问题/现象： Anchor-based Siamese trackers have achieved remarkable advancements in accuracy, yet…...

编程日记 2025/8/3 15:00:39

java中的循环结构

文章目录流程控制顺序结构if单选择结构if双选择结构if多选择结构嵌套的if结构switch多选择结构循环结构while循环do...while循环 for循环增强for循环 break continue练习案例流程控制顺序结构 java的基本结果就是顺序结构，除非特别指明，否则就按照…...

编程日记 2025/7/31 13:52:46

数学复习笔记 16

前言例题真是经典。 background music 《青春不一样》 2.28 算一个行列式，算出来行列式不等于零，这表示矩阵式可逆的。但是这个算的秩是复合的，感觉没啥好办法了，我直接硬算了，之后再看解析积累好的方法。算矩阵…...

编程日记 2025/7/24 18:31:20

PySide6 GUI 学习笔记——常用类及控件使用方法（常用类颜色QColor）

文章目录一、概述二、核心功能三、常用函数及方法四、代码示例五、注意事项一、概述 QColor 是用于处理颜色的类，支持 RGB、HSV、HSL、CMYK 等多种颜色模型，提供颜色创建、转换、分量操作及格式转换功能。支持透明度设置，可通过颜色名称或…...

编程日记 2025/8/2 15:28:44

【Closure-Hayd】

RNA序列本身存在结构上的物理信息，因此可以利用文献提供的相关方法来对RNA序列的物理特征进行更加细致的提取。几何向量编码（GVP模块）借鉴Rhodesign模型中的GVP（Geometric Vector Perceptron）模块，将每个…...

编程日记 2025/8/2 12:37:47

MySQL高可用架构

一、读写分离在高可用架构中的核心作用 1.读写分离与高可用的协同价值在MySQL高可用架构中，读写分离不仅是性能优化的手段，更是提升系统容错能力的关键策略。通过将写操作（INSERT、UPDATE、DELETE） 集中到主节点，读…...

编程日记 2025/8/3 3:52:14

粒子群算法（PSO算法）

粒子群算法概述 1.粒子群优化算法（Particle Swarm Optimization，简称PSO）。粒子群优化算法是在1995年由Kennedy博士和Eberhart博士一起提出的，它源于对鸟群捕食行为的研究。 2.基本核心是利用群体中的个体对信息的共享从而使得整…...

编程日记 2025/8/2 9:24:00

信道编码技术介绍

信息与通信系统中的编码有4 种形式：信源编码、信道编码、密码编码和多址编码。其中信道编码的作用是对信源经过压缩后的数据加一定数量受到控制的冗余，使得数据在传输中或接收中发生的差错可以被纠正或被发现，从而可以正确恢复出原始数据信息…...

编程日记 2025/7/28 13:00:01

JavaScript【4】数组和其他内置对象(API)

1.数组: 1.概述: js中数组可理解为一个存储数据的容器,但与java中的数组不太一样;js中的数组更像java中的集合,因为此集合在创建的时候,不需要定义数组长度,它可以实现动态扩容;js中的数组存储元素时,可以存储任意类型的元素,而java中的数组一旦创建后,就只能存储定义类型的元…...

编程日记 2025/8/3 2:23:30

【背包dp-----分组背包】------（标准的分组背包【可以不装满的最大价值】）

通天之分组背包题目链接题目描述自 01 01 01 背包问世之后，小 A 对此深感兴趣。一天，小 A 去远游，却发现他的背包不同于 01 01 01 背包，他的物品大致可分为 k k k 组，每组中的物品相互冲突，现在&a…...

编程日记 2025/8/1 10:45:43

docker-compose——安装mongo

编写docker-compose.yml version : 3.8services:zaomeng-mongodb:container_name: zaomeng-mongodbimage: mongo:latestrestart: alwaysports:- 27017:27017environment:- MONGO_INITDB_ROOT_USERNAMEroot- MONGO_INITDB_ROOT_PASSWORDpssw0rdvolumes:- ./mongodb/data:/data/…...

编程日记 2025/7/19 2:32:42

day 28

类一个常见的类的定义包括了： 1. 关键字class 2. 类名 3. 语法固定符号冒号(:) 4. 一个初始化函数__init__(self) Pass占位符和缩进 Python 通过缩进来定义代码块的结构。当解释器遇到像 def, class, if, for 这样的语句，并且后面跟着冒号 : 时&…...

编程日记 2025/7/30 1:26:51

JavaScript入门【1】概述

1.JavaScript是什么? <font style"color:rgb(38,38,38);">Javascript （简称“JS”）是⼀种直译式脚本语⾔，⼀段脚本其实就是⼀系列指令，计算机通过这些指令来达成⽬标。它⼜是⼀种动态类型的编程语⾔。JS⽤来在⽹…...

编程日记 2025/7/30 21:14:15

MySQL 中 JOIN 和子查询的区别与使用场景

目录一、JOIN：表连接1.1 INNER JOIN：内连接1.2 LEFT JOIN：左连接1.3 RIGHT JOIN：右连接1.4 FULL JOIN：全连接二、子查询：嵌套查询2.1 WHERE 子句中的子查询2.2 FROM 子句中的子查询2.3 SELECT 子句中的子查询三、JOIN 和子查询的区别3.1 功能差异3.2 性能差异3.3 使用场…...

编程日记 2025/7/31 17:26:09

DeepSeek 大模型部署全指南：常见问题、优化策略与实战解决方案

DeepSeek 作为当前最热门的开源大模型之一，其强大的语义理解和生成能力吸引了大量开发者和企业关注。然而在实际部署过程中，无论是本地运行还是云端服务，用户往往会遇到各种技术挑战。本文将全面剖析 DeepSeek 部署中的常见问题，提…...

编程日记 2025/7/31 14:30:33

Python 3.11详细安装步骤（包含安装包）Python 3.11详细图文安装教程

文章目录前言Python 3.11介绍Python 3.11安装包下载Python 3.11安装步骤前言作为当前最热门的编程语言之一，Python 3.11 不仅拥有简洁优雅的语法，还在性能上实现了飞跃，代码运行速度提升显著。无论是初入编程的小白，还是经验丰…...

编程日记 2025/8/2 13:29:17

虚拟主播肖像权保护，数字时代的法律博弈

首席数据官高鹏律师团队在虚拟主播行业蓬勃发展的表象之下，潜藏着一场关乎法律边界的隐形战争。当一位虚拟偶像的3D模型被非法拆解、面部数据被批量复制，运营方惊讶地发现——传统的肖像权保护体系，竟难以完全覆盖这具由代码与数据构成的“…...

编程日记 2025/8/1 8:13:22

硬件工程师笔记——二极管Multisim电路仿真实验汇总

目录 1 二极管基础知识 1.1 工作原理 1.2 二极管的结构 1.3 PN结的形成 1.4 二极管的工作原理详解正向偏置反向偏置 multisim使用说明链接 2 二极管特性实验 2.1 二极管加正向电压 2.2 二极管加反向电压 2.3 二极管两端的电阻 2.4 交流电下二级管工作 2.5 二极…...

编程日记 2025/7/29 23:26:04

学习笔记（C++篇）—— Day 6

1.内部类如果一个类定义在另一个类的内部，就叫做内部类。例如下面一个代码示例： class A { private:static int _k;int _h 1; public:class B // B默认就是A的友元{public:void foo(const A& a){cout << _k << endl; //OKcout <&…...

编程日记 2025/7/28 19:35:49

常见的实时通信技术（轮询、sse、websocket、webhooks）

1. HTTP轮询：最老实的办法刚开始做实时功能时，我第一个想到的就是轮询。特别简单直白，就像你每隔5分钟就刷新一次朋友圈看看有没有新消息一样。短轮询：勤快但费劲短轮询就是客户端隔三差五地问服务器："有新…...

编程日记 2025/8/2 3:26:52

2025年第三届盘古石杯初赛（智能冰箱，监控部分）

前言所以去哪里可以取到自己家里的智能家居数据呢？？？？ IOT物联网取证 1、分析冰箱，请问智能冰箱的品牌？ [答案格式：xiaomi] Panasonic2、请问智能冰箱的型号？ [答案格式&#x…...

编程日记 2025/7/27 1:19:33

[强化学习的数学原理—赵世钰老师]学习笔记02-贝尔曼方程

本人为强化学习小白，为了在后续科研的过程中能够较好的结合强化学习来做相关研究，特意买了西湖大学赵世钰老师撰写的《强化学习数学原理》中文版这本书，并结合赵老师的讲解视频来学习和更深刻的理解强化学习相关概念，知识和算法技…...

编程日记 2025/8/3 1:51:51

基于STM32的INA226电压电流检测仪

系统总体框图功率检测装置原理图功能及模块连接说明一、系统功能概述该装置以STM32F103C8T6微控制器为核心，集成功率检测、数据交互、状态显示和用户提示功能，通过模块化设计实现稳定运行。二、各模块功能及连接方式按键模块功能&#xff1a…...

编程日记 2025/7/31 12:01:13

Android7 Input（七）App与input系统服务建立连接

概述本文主要讲述Android 系统创建窗口时与输入管理系统服务通过InputChannel通道建立通信桥梁的过程。本文涉及的源码路径 frameworks/native/libs/input/InputTransport.cpp frameworks/base/core/java/android/view/InputChannel.java frameworks/base/core/java/andr…...

编程日记 2025/7/27 13:49:00

1.2 C++第一个程序

第一个程序：Hello World 教程目标用 cout 输出文字，学会用 endl 换行。理解程序的基本结构，明白 main 函数的作用。一、程序是什么？——像“魔法食谱” 比喻：写程序就像写一份做蛋糕的食谱！ 食材&am…...

编程日记 2025/8/3 5:15:07

Hi3516DV500刷写固件

hi3516DV500刷固件 1、硬件连接 2、软件准备 3、刷固件步骤一、硬件连接特别注意的是，串口的接线顺序通过网线连接好笔记本和开发板后，需要确认一下网口水晶头是否闪烁，以确认网络物理是否连通二、软件资源准备固件包准备打开工具…...

编程日记 2025/7/23 16:47:34

完整卸载 Fabric Manager 的方法

目录 ✅ 完整卸载 Fabric Manager 的方法 1️⃣ 停止并禁用服务 2️⃣ 卸载 Fabric Manager 软件包 3️⃣ 自动清理无用依赖（可选） 4️⃣ 检查是否卸载成功 ✅ 补充（仅清除服务，不删包） ✅ 完整卸载 Fabric Mana…...

编程日记 2025/7/18 21:40:10

linux标准库头文件解析

linuxc标准库 C 标准库（C Standard Library）包含了一组头文件，这些头文件提供了许多函数和宏，用于处理输入输出、字符串操作、数学计算、内存管理等常见编程任务。。头文件功能简介<stdio.h>标准输入输出库，包含…...

编程日记 2025/7/29 21:03:37

PLC和变频器之间如何接线

这篇文章想梳理一下，不同电平输出的PLC应该如何去接不同品牌的变频器对于PLC的IO来讲，有高低电平输入的不同，有高低电平输出的区别对于变频器的DI或DO来讲，不同的品牌内部线路和原理也有区别我们场地现在用的是西门子1200的…...

编程日记 2025/7/30 23:43:52

【Spring】Spring的请求处理

欢迎来到啾啾的博客🐱。记录学习点滴。分享工作思考和实用技巧，偶尔也分享一些杂谈💬。欢迎评论交流，感谢您的阅读😄。目录引言HTTP/HTTPS协议Spring Web与Spring Web MVCSpring WebFlux 自定义的TPC/IP协议FTP、S…...

编程日记 2025/7/30 17:31:45

现代健康生活养生指南

现代社会中，熬夜加班、久坐不动、饮食不规律成为许多人的生活常态，由此引发的健康问题也日益增多。想要摆脱亚健康，不必依赖中医理念，从以下这些现代科学养生方法入手，就能逐步改善身体状况。饮食上，注…...

编程日记 2025/7/31 20:09:08

使用tensorRT10部署低光照补偿模型

1.低光照补偿模型的简单介绍作者介绍一种Zero-Reference Deep Curve Estimation (Zero-DCE)的方法用于在没有参考图像的情况下增强低光照图像的效果。具体来说，它将低光照图像增强问题转化为通过深度网络进行图像特定曲线估计的任务。训练了一个轻量级的深度网络…...

编程日记 2025/8/3 8:25:12

题单：表达式求值1

题目描述给定一个只包含 “加法” 和 “乘法” 的算术表达式，请你编程计算表达式的值。输入格式输入仅有一行，为需要计算的表达式，表达式中只包含数字、加法运算符和乘法运算符 *，且没有括号。所有参与运算的数字不超过…...

编程日记 2025/8/2 13:28:34

【ant design】ant-design-vue 4.0实现主题色切换

官网：Ant Design Vue — An enterprise-class UI components based on Ant Design and Vue.js 我图方便，直接在 app.vue 中加入的 <div class"app-content" v-bind:class"appOption.appContentClass"><a-config-provider…...

编程日记 2025/8/1 9:44:52

MinIO深度解析：从入门到实战——对象存储系统全指南

在当今数字化时代，数据存储至关重要。MinIO作为一款高性能的对象存储系统，正逐渐受到广泛关注。它与云原生存储系统相媲美，并且其API与Amazon S3完全兼容。本文将带您快速了解MinIO，并探讨其在实际中的应用场景。一、关于MinIO …...

编程日记 2025/7/27 10:30:16

（8）python开发经验

文章目录 1 下载python2 pip安装依赖无法访问3 系统支持4 下载python文档5 设置虚拟环境6 编译安装python 更多精彩内容👉内容导航 👈👉Qt开发 👈👉python开发 👈 1 下载python 下载地址尽量不要下载最新版…...

编程日记 2025/7/31 8:13:20

uniapp自动构建pages.json的vite插件

对于 uniapp 来说，配置 pages.json 无疑是最繁琐的事情，具有以下缺点： 冗长，页面很多时 pages 内容会很长难找，有时候因为内容很长，导致页面配置比较难找，而且看起来比较凌乱json弊端&#xff…...

编程日记 2025/8/3 1:49:56

【MySQL进阶】如何在ubuntu下安装MySQL数据库

前言 🌟🌟本期讲解关于如何在ubuntu环境下安装mysql的详细介绍~~~ 🌈感兴趣的小伙伴看一看小编主页：GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 &#x1f3…...

编程日记 2025/7/31 7:00:10

解放双手的全自动抠图工具

软件介绍本文要介绍的这款软件是Teorex PhotoScissors，是一款全自动抠图软件。第二段：软件便捷性这款来自国外的软件堪称神器，目前已解锁可无限使用。使用起来特别方便，无需安装，打开即可直接操作，并…...

编程日记 2025/7/27 12:32:13

Python多进程编程执行任务

我的需求如下：现有一批任务，使用进程池执行，每个任务执行耗时不一样，任务并发执行期间，需要每隔一段时间监控任务执行进度直接贴代码： import multiprocessing import time import random from multiproc…...

编程日记 2025/7/29 8:57:36

【Linux笔记】——Linux线程封装

🔥个人主页🔥：孤寂大仙V 🌈收录专栏🌈：Linux 🌹往期回顾🌹：【Linux笔记】——Linux线程控制创建、终止与等待|动态库与内核联动 🔖流水不争，争的是…...

编程日记 2025/7/30 1:52:55

ChatGPT + DeepSeek 联合润色的 Prompt 模板指令合集，用来润色SCI论文太香了！

对于非英语母语的作者来说，写SCI论文的时候经常会碰到语法错误、表达不够专业、结构不清晰以及术语使用不准确等问题。传统的润色方式要么成本高、效率低，修改过程又耗时又费力。虽然AI工具可以帮助我们来润色论文，但单独用ChatGPT或DeepSeek都会存在内容泛泛、专业性不足的…...

编程日记 2025/7/31 4:53:59

【typenum】 9 与常量泛型桥接（generic_const_mappings.rs）

一、源码该代码提供了常量结构体与库类型的转换。 // THIS IS GENERATED CODE //! Module with some const-generics-friendly definitions, to help bridge the gap //! between those and typenum types. //! //! - It requires the const-generics crate feature to be…...

编程日记 2025/7/28 6:51:47

并发学习之synchronized，JVM内存图，线程基础知识

文章目录 Java内存图内存图区域介绍执行流程进程和线程概念解释线程的6种状态简述等待队列和同步队列（阻塞队列）线程之间是独立的 synchronized静态方法非静态方法代码块知识总结： 方法区存储类信息正在执行的程序叫进程，进程会…...

编程日记 2025/7/30 19:29:47

使用Docker部署Nacos

sudo systemctl start docker sudo systemctl enable docker docker --version 步骤 2: 拉取 Nacos Docker 镜像拉取 Nacos 镜像： 你可以从 Docker Hub 上拉取官方的 Nacos 镜像，使用以下命令： docker pull nacos/nacos-server 这会从 …...

编程日记 2025/7/27 8:08:55

如何 naive UI n-data-table 改变行移动光标背景色

默认是light 灰，想换个显眼包色，折腾半天，可以了。无废话上代码： <template><n-data-tablesize"small":columns"columns":data"sortedDataList":bordered"true":row-key"…...

编程日记 2025/8/3 13:01:13

Maven 插件扩展点与自定义生命周期

🧑 博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编…...

编程日记 2025/8/1 17:01:20

Redis的发布订阅模型是什么，有哪些缺点？

Redis 发布订阅模型概述 Redis 发布订阅（Pub/Sub）是一种消息广播模式，核心角色包括： 发布者（Publisher）：向指定频道（Channel）发送消息。频道（Channel&#…...

编程日记 2025/8/2 22:29:00

【EDA软件】【联合Modelsim仿真使用方法】

背景业界EDA工具仿真功能是必备的，例如Vivado自带仿真工具，且无需联合外部仿真工具，例如MoodelSim。 FUXI工具仿真功能需要联合Modelsim，才能实现仿真功能。方法一：FUXI联合ModelSim 1 添加testbench文件新建to…...

编程日记 2025/8/1 22:45:45

C语言_动态内存管理

1. 为什么存在动态内存分配 ? 当前，我们掌握的内存开辟方式有： int val22;// 在栈空间上开辟四个字节 char arr[10]{0};// 在栈空间上开辟10个字节的连续空间而上述的开辟空间的方式有两个特点： 空间开辟大小示固定的数组在申明的时候&am…...

编程日记 2025/8/3 1:49:59

相关文章：