当前位置：首页 > news >正文

深度学习基础--目标检测常见算法简介(R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN、SSD、YOLO)

news 来源：原创 2025/8/6 0:49:26

在这里插入图片描述

博主简介：努力学习的22级本科生一枚 🌟；探索AI算法，C++，go语言的世界；在迷茫中寻找光芒🌸
博客主页：羊小猪~~-CSDN博客
内容简介：常见目标检测算法简介😕😕😕😕😕😕😕😕😕
往期内容：深度学习基础–目标检测入门简介-CSDN博客

文章目录

1、tow-stage
R-CNN
Fast R-CNN
Faster R-CNN
Mask R-CNN

2、one-stage
单发多宽检测(SSD)
YOLO

3、参考资料

1、tow-stage

R-CNN

最早的目标检测模型。

在这里插入图片描述

📖 简介：

传统目标检测的思路，采用提取框，对每个提取框进行特征提取、图像分类、非极大值抑制四个步骤进行检测。

对于一张图片来说，R-CNN首先会基于启发式搜索算法生成大约2000个候选区域，然后每个区域固定大小，并且传入一个CNN模型中，最后得到一个特征向量，这个向量会传到一个SVM模型中，进行类别计算，进行分类，并且，最后运用了一个边界框回归模型，通过边框回归模型对框的准确位置进行修正。

📚 解释一些名词：

启发式搜索，这个算很难，也包含很多算法，简单理解他的作用是在图片上选取物体可能出现的区域框(锚框);
非极大值抑制：是一种在目标检测中去除冗余边界框的后处理算法，通过保留局部得分最高的检测框并抑制与其重叠度（IoU）超过阈值的低得分框，实现检测结果的唯一性与精确性；这个在上一篇博客中已经简单介绍了(深度学习基础–目标检测入门简介-CSDN博客)，就是去除多余的锚框；

🐾 算法步骤：

使用启发式搜索来选择锚框；
使用预训练模型来对每个锚框抽取特征；
训练一个SVM来对类别进行分类；
训练一个线性回归模型来预测边缘框的偏移，这一步就是将锚框来预测他真实的位置(边缘框)偏移；

上面简介中提到每个区域固定大小，但是实际上用启发式算法进行搜索的时候，每次选择的锚框大小是不同的，将不同大小的锚框变成一个统一形状的算法就是Rol pooling;

💁‍♂ Rol pooling，也称感兴趣域池化层，作用是将大小不一的锚框统一形状。

📘 原理：

给定一个锚框，先将其均匀地分割成 n * m 块，然后输出每块里的最大值，这样的话，不管锚框有多大，只要给定了 n 和 m 的值，总是输出 nm 个值，达到统一形状的作用。

在这里插入图片描述

缺点：虽然有效提取了特征，但是速度非常慢，因为在第二个步骤用训练好的模型对每个锚框进行特征提取的时候，计算非常大(因为启发式算法大约生成2000个框)。

Fast R-CNN

🐤R-CNN:

对每个锚框分别进行特征提取；
R-CNN是前向传播的，而且比如说对一张图片划分了2000张锚框，那么在进行特征提取的时候通常会有重叠部分，故导致了从重复计算。Fast R-CNN就是解决这个问题的；

🥅 Fast R-CNN网络图：

在这里插入图片描述

🚂 原理简介，与R-CNN对比着看：

首先由两进行两部计算，分别是锚框生成、图片特征提取，对应着上图中两条分支：
- 锚框生成：和R-CNN一样；
- 特征提取(CNN)：对于一张图片，首先使用CNN对整张图片进行特征提取；
Rol pooling这里有两步：
- 1️⃣映射：锚框(selective search)按照一定比例映射到特征提取(CNN)的输出上；
- 2️⃣ Rol pooing：这一步和R-CNN一样，统一锚框大小。
之后采用一个全连接层进行分类(R-CNN用的是SVM)，输出类别。

🚅比R-CNN快的原因：最核心的原因就是只需要对整体图片进行一次特征提取就行了，不需要分别对每个锚框进行特征提取。

Faster R-CNN

这个算法的改进是提出来RPN(区域建议网络)来代替selective search；

在这里插入图片描述

🔖 RPN简介：

这个网络学习的时候理解起来还是有难度的😢

🎡 作用：生成大量很差的锚框，然后进行预测，最终输出比较好的锚框供后面网络使用(预测效果好的会进入Rol Pooing)；

😿 原理简介：

CNN特征提取后，再次运用一次卷积操作，然后用启发式算法搜索来初始化锚框；
然后判断锚框是否包含物体，这里分为两步：
- 1️⃣ 分类：RPN对每个锚框进行分类，判断他是否包含目标物体，这里输出的是一个概率值；
- 2️⃣ 回归：调整锚框位置和大小；
最后采用NMS对锚框进行筛选。

🉐 特点：精度高，但是计算量巨大，慢。

Mask R-CNN

这个算法是对Faster R-CNN基础上修改而来，他的作用是：解决传统目标检测，即只输出边界框无法提供像素级分割信息的问题。

像素级分割：生成每个物体的精确轮廓掩码.

在这里插入图片描述

从图像看的话，对比Fast R-CNN，有两个不同：

用Rol align代替Rol pooling；
在Rol align上新增一个分支；

这个难度我学的时候也很蒙，感觉好难😢

在学这个网络前，先学一下什么叫做二值掩码：

二值掩码是一种由0和1(或255)组成的二值图像，用于标记原始图像中需要关注或操作的区域。上图的右下部分图。

🔬 难度大，梳理一下网络:

特征提取
- 输入图像通过卷积神经网络生成特征图。
区域建议网络（RPN）
- 在特征图上生成锚框，通过分类和回归生成候选区域，这部分和Fast R-CNN一样。
RoI Align
- 将候选区域映射到特征图上，使用双线性插值提取固定大小的特征（如 7×77×7 或 14×1414×14），与Rol pooling不同的是映射算法不同。
分类与回归分支
- 对每个 RoI 进行分类和边界框修正，这部分和Fast R-CNN一样。
掩码分支
- 对每个 RoI 生成二值掩码，最终通过阈值化得到像素级分割结果，先理解为对不同物体分别进行不同颜色可视化即可😭，由于是像素级别的，故大概轮廓也能显示出来。
全连接层
- 进行图片分类。

2、one-stage

单发多宽检测(SSD)

👀 先看网络结构：

在这里插入图片描述

初看网络结构，可以观察到他也是前向传播的，而且在传播的时候一直进行预测。

👀再看

在这里插入图片描述

👓 特点：

对给定的锚框直接进行预测，不需要进行两个阶段，这也是为什么比Faster R-CNN快的原因；
SSD 通过做不同分辨率下的预测来提升最终的效果，越到底层的 feature map，就越大，越往上，feature map 越少，因此底层更加有利于小物体的检测，而上层更有利于大物体的检测）

😢 缺点：

速度快，但是精度不好。

YOLO

➿ 用最多的模型。

在这里插入图片描述

📚 解释：

尽量让锚框不重叠—–》将图片均匀分成S X S个锚框。
每个锚框预测B个边缘框，这个意思是一个锚框可能有多个物体，故在他身边预测多个锚框进行特征提取、分类，如上图中的蓝色圆圈。

YOLO有很多版本，也非常值得学习的。

3、参考资料

【44 物体检测算法：R-CNN，SSD，YOLO【动手学深度学习v2】】https://www.bilibili.com/video/BV1Db4y1C71g?vd_source=1fd424333dd77a7d3e2e741f7d6fd4ee
R-CNN_百度百科
李沐动手学深度学习V2-目标检测SSD_深度学习与目标检测第2版第二版-CSDN博客

深度学习基础--目标检测常见算法简介(R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN、SSD、YOLO)

博主简介：努力学习的22级本科生一枚 🌟；探索AI算法，C，go语言的世界；在迷茫中寻找光芒🌸 博客主页：羊小猪~~-CSDN博客内容简介：常见目标检测算法简介&#x1f…...

编程日记 2025/8/6 0:49:26

嵌套路由~

### 作业 - App.vue vue <script setup></script> <template> <router-link to"/home">首页</router-link> <router-link to"/profile">个人资料</router-link> <router-link to"/posts"&g…...

编程日记 2025/8/4 10:09:07

影楼精修-牙齿美型修复算法解析

本文介绍影楼修图中的牙齿美型修复功能的算法实现。我们大部分人的牙齿看起来都可能会有一些问题，比如牙齿不平整，大门牙，牙齿泛黄，牙齿发黑，牙齿残缺等等，拍照之后影响美观度，正是这个爱美的…...

编程日记 2025/8/4 10:09:05

k8s之ingress

在前面我们已经知道，Service对集群之外暴露服务的主要方式有两种：NodePort 和 LoadBalance，但是这两种方式，都有一定的缺点 NodePort方式的缺点是会占用很多集群机器的端口，那么当集群服务变多的时候，这个缺点就更加明显，L4转发，无法根据http header和path进行路由转发…...

编程日记 2025/8/4 10:09:03

PDF文档解析新突破：图表识别、公式还原、手写字体处理，让AI真正读懂复杂文档！

要想LLM大模型性能更佳，我们需要喂给模型看得懂的高质量数据。那有没有一种方法，能让我们把各种文档“读懂”，再喂给大模型使用呢？ 如果你用传统OCR工具直接从PDF中提取文本，结果往往是乱序、缺失、格式错乱。因为实际…...

编程日记 2025/8/4 10:09:01

Ubuntu 第11章网络管理_常用的网络配置命令

为了管理网络，Linux提供了许多非常有用的网络管理命令。利用这些命令，一方面可以有效地管理网络，另一方面出现网络故障时，可以快速进行诊断。本节将对Ubuntu提供的网络管理命令进行介绍。 11.2.1 ifconfig命令关于ifconfig命令&…...

编程日记 2025/8/2 12:30:43

C++ 观察者模式详解

观察者模式（Observer Pattern）是一种行为设计模式，它定义了对象间的一对多依赖关系，当一个对象（主题）状态改变时，所有依赖它的对象（观察者）都会自动得到通知并更新。核…...

编程日记 2025/8/2 12:30:41

不止是UI库：React如何重塑前端开发范式？

React：引领现代前端开发的声明式UI库在当今快速发展的前端世界，React以其声明式、组件化和高效的特性，稳坐头把交椅，成为构建交互式用户界面的首选JavaScript库。本文将带你快速了解React的核心魅力、主要优势以及生态发展&…...

编程日记 2025/8/2 12:30:39

MapReduce报错 HADOOP_HOME and hadoop.home.dir are unset.

运行课程讲解内容出现这个报错： 1、在电脑里解压之前发过的Hadoop安装包 2、配置用户变量 3、配置系统变量 4、配置系统Path变量 5、下载链接的两个文件： 链接: https://pan.baidu.com/s/1aCcpGGR1EE4hEZW624rFmQ?pwd56tv 提取码: 56tv –来自百度…...

编程日记 2025/8/2 12:30:37

深入探索Laravel框架中的Blade模板引擎

Laravel是一个广泛使用的PHP框架，以其简洁、优雅和强大的功能著称。Blade是Laravel内置的模板引擎，提供了一套简洁而强大的模板语法，帮助开发者轻松构建视图层。本文将深入探讨Blade模板引擎的特性、使用方法和最佳实践。 1. Blade模板引擎简…...

编程日记 2025/8/2 12:30:36

分析NVIDIA的股价和业绩暴涨的原因

NVIDIA自2016年以来股价与业绩的持续高增长，是多重因素共同作用的结果。作为芯片行业的领军企业，NVIDIA抓住了技术、战略、市场与行业趋势的机遇。以下从技术创新、战略布局、市场需求、财务表现及外部环境等维度，深入分析其成功原因&#xf…...

编程日记 2025/8/2 12:30:34

P2572 [SCOI2010] 序列操作 Solution

Description 给定 01 01 01 序列 a ( a 1 , a 2 , ⋯ , a n ) a(a_1,a_2,\cdots,a_n) a(a1,a2,⋯,an)，并定义 f ( l , r ) [ ( ∑ i l r a i ) r − l 1 ] f(l,r)[(\sum\limits_{il}^r a_i)r-l1] f(l,r)[(il∑rai)r−l1]. 执行 m m m 个操作&am…...

编程日记 2025/8/2 12:30:32

初等数论--欧拉函数积性的证明

文章目录 1. 简介2. 证明一：唯一分解定理容斥原理3. 证明二：中国剩余定理4. 引理证明5. 参考 1. 简介欧拉函数 ϕ ( n ) \phi(n) ϕ(n)表示在小于等于 n n n的正整数中与 n n n互质的个数。如 ϕ ( 6 ) 2 ( 1 5 ) ϕ ( 12 ) 4 ( 1 5 7 11 ) \phi(…...

编程日记 2025/8/2 12:30:30

MCP（Model Context Protocol）是专为LLM（大语言模型）应用设计的标准化协议

核心定义 MCP（Model Context Protocol）是专为LLM（大语言模型）应用设计的标准化协议，通过安全可控的方式向AI应用暴露数据和功能。主要提供以下能力： 标准化的上下文管理安全的功能调用接口跨平台的数据交…...

编程日记 2025/8/2 12:30:28

Midscene.js Chrome 插件实战：AI 驱动的 UI 自动化测试「喂饭教程」

Midscene.js Chrome 插件实战：AI 驱动的 UI 自动化测试「喂饭教程」前言一、Midscene.js 简介二、环境准备与插件安装1. 安装 Chrome 插件2. 配置模型与 API Key三、插件界面与功能总览四、实战演练：用自然语言驱动网页自动化1. 典型场景一（Action）：账号登录步骤一：打开…...

编程日记 2025/8/2 12:30:26

Python在大数据机器学习模型的多模态融合：深入探索与实践指南

一、多模态融合的全面概述 1.1 多模态融合的核心概念多模态融合(Multimodal Fusion)是指将来自不同传感器或数据源(如图像、文本、音频、视频、传感器数据等)的信息进行有效整合，以提升机器学习模型的性能和鲁棒性。在大数据环境下，多模态融合面临着独特的挑战和机遇：数…...

编程日记 2025/8/2 12:30:24

C++ 访问者模式详解

访问者模式（Visitor Pattern）是一种行为设计模式，它允许你将算法与对象结构分离，使得可以在不修改现有对象结构的情况下定义新的操作。核心概念设计原则访问者模式遵循以下设计原则： 开闭原则：可以添…...

编程日记 2025/8/2 12:30:21

实验-有限状态机2（数字逻辑）

目录一、实验内容 1.1 介绍 1.2 内容二、实验步骤 2.1 电路原理图 2.2 步骤 2.3 状态图 4.4 状态转换表和输出表 2.5 具体应用场景三、调试四、实验使用环境五、实验小结与思考 5.1 遇到的问题及解决方法 5.2 实验收获一、实验内容 1.1 介绍在解决更复…...

编程日记 2025/8/2 12:30:19

IC解析之TPS92682-Q1(汽车LED灯控制IC)

目录 1 IC特性介绍2 主要参数3 接口定义4 工作原理分析TPS92682-Q1架构工作模式典型应用通讯协议控制帧应答帧协议5 总结 1 IC特性介绍 TPS92682 - Q1 是德州仪器（TI）推出的一款双通道恒压横流控制器，同时还具有各种电器故障保护&#xff0c…...

编程日记 2025/8/2 12:30:17

数据结构-堆

目录 heapq 导入初始化插入元素返回最小值 PriorityQueue 导入初始化入队出队堆是一颗树，其每个节点都有一个值，且（小根堆：每个父节点都小于等于其子节点 （在进树时不断进行比较 STL中的 priority…...

编程日记 2025/8/2 12:30:15

提升编程效率的利器：Zed高性能多人协作代码编辑器

在当今这个快节奏的开发环境中，一个高效、灵活的代码编辑器无疑对开发者们起着至关重要的支持作用。Zed，作为来自知名编辑器Atom和语法解析器Tree-sitter的创造者的心血之作，正是这样一款高性能支持多人合作的编辑神器。本文将带领大家深入探…...

编程日记 2025/8/2 12:30:13

【25软考网工】第六章网络安全（1）网络安全基础

博客主页： christine-rr-CSDN博客专栏主页： 软考中级网络工程师笔记大家好，我是christine-rr !目前《软考中级网络工程师》专栏已经更新二十多篇文章了，每篇笔记都包含详细的知识点，希望能帮助到你！ 今日…...

编程日记 2025/8/2 12:30:11

Java中的包装类

目录为什么要有包装类包装类的作用基本数据类型和包装类的对应关系包装类的核心功能装箱（Boxing）和拆箱（Unboxing） 装箱： 拆箱： 类型转换字符串<----->基本类型进制转换自动装箱与…...

编程日记 2025/8/2 12:30:09

催缴机器人如何实现停车费追缴“零遗漏”？

面对高达35%的停车欠费率，传统人工催缴模式因效率低、成本高、覆盖有限等问题，难以应对海量欠费订单的挑战。本文带大家探究“催缴机器人”如何实现停车费追缴“零遗漏”，实现从“被动催缴”到“主动管理”的跨越。智慧停车欠费自动化追缴系…...

编程日记 2025/8/1 10:00:05

Oracle 执行计划中的 ACCESS 和 FILTER 详解

Oracle 执行计划中的 ACCESS 和 FILTER 详解在 Oracle 执行计划中，ACCESS 和 FILTER 是两个关键的操作类型，它们描述了 Oracle 如何检索和处理数据。理解这两个概念对于 SQL 性能调优至关重要。 ACCESS（访问） ACCESS 表示 Ora…...

编程日记 2025/8/1 10:00:03

使用FastAPI微服务在AWS EKS中构建上下文增强型AI问答系统

系统概述本文介绍如何使用FastAPI在AWS Elastic Kubernetes Service (EKS)上构建一个由多个微服务组成的AI问答系统。该系统能够接收用户输入的提示(prompt)，通过调用其他微服务从AWS ElastiCache on Redis和Amazon DynamoDB获取相关上下文，然后利用AW…...

编程日记 2025/8/1 10:00:01

oracle dblink varchar类型查询报错记录

在使用Oracle DBLink（数据库链接）查询VARCHAR类型数据时，有时会遇到报错问题。这些错误可能与数据类型转换、字符集设置、数据库版本兼容性等因素有关。本文将详细分析常见的报错原因及其解决方法。一、常见报错及其原因 1. ORA-01722: in…...

编程日记 2025/8/1 9:59:59

计算人声录音后电平的大小(dB SPL-＞dBFS)

计算人声录音后电平的大小这里笔记记录一下，怎么计算已知大小的声音，经过麦克风、声卡录制后软件内录得的音量电平值。（文章最后将计算过程整理为Python代码，方便复用） 假设用正常说话的声音大小65dB（SP…...

编程日记 2025/8/1 9:59:57

Android kernel日志中healthd关键词意义

Android kernel日志中healthd关键词意义在kernel的healthd日志中会打印电池信息。通常比较关心的是电池温度，剩余电量，电压，电池健康，电池状况等。 level：剩余电量。 voltage：电压。 temperature&#xff…...

编程日记 2025/8/1 9:59:54

操作系统面试问题（4）

32.什么是操作系统操作系统是一种管理硬件和软件的应用程序。也是运行在计算机中最重要的软件。它为硬件和软件提供了一种中间层，让我们无需关注硬件的实现，把心思花在软件应用上。通常情况下，计算机上会运行着许多应用程序，它…...

编程日记 2025/8/1 9:59:52

【nestjs】一般学习路线

nestjs中文文档其实几个月前也对nestjs进行了学习，前前后后看了很多文档、博客，另外也找了相应的代码看了，但最后也还是一知半解，只是知道大概怎么写，怎么用。这次下定决心再次看一遍，从代码学习到文档…...

编程日记 2025/8/1 9:59:50

多线程面试题总结

基础概念进程与线程的区别进程：操作系统资源分配的基本单位，有独立内存空间线程：CPU调度的基本单位，共享进程资源对比：创建开销：进程 > 线程通信方式：进程(IPC)、线程(共享内存)安全性：进程更安全(隔离)，线程需要同步线程的生命周期与状态转换 NEW → RUNNABLE …...

编程日记 2025/8/1 9:59:48

面试常考算法2（核心+acm模式）

15. 三数之和核心代码模式 class Solution {public List<List<Integer>> threeSum(int[] nums) {List<List<Integer>> ansnew ArrayList<>();Arrays.sort(nums);int lennums.length;int pre2000000;for(int i0;i<len-2;i){while(i<len-…...

编程日记 2025/8/1 9:59:46

虚拟文件系统

虚拟文件系统（Virtual File System，VFS）是操作系统内核中的一个抽象层，它为不同的文件系统（如ext4、NTFS、FAT32等）提供统一的访问接口。通过VFS，用户和应用程序无需关心底层文件系统的具体差异…...

编程日记 2025/8/1 9:59:44

机器学习与深度学习的区别与联系：多角度详细分析

机器学习与深度学习的区别与联系：多角度详细分析引言随着人工智能技术的快速发展，机器学习和深度学习已成为当今科技领域的核心驱动力。尽管这两个术语经常被一起提及，甚至有时被互换使用，但它们之间存在着明显的区别和紧密的…...

编程日记 2025/8/1 9:58:54

c++：迭代器（Iterator）

目录 🚪什么是迭代器？ 🔧 迭代器的本质为什么不用普通数组或下标？ STL容器的迭代器并不是共用一个类型！ 迭代器的类型（Iterator Categories） 📦 常见容器的迭代器类型 ✅ 迭…...

编程日记 2025/8/1 9:58:52

MindSpore框架学习项目-ResNet药物分类-数据增强

目录 1.数据增强 1.1设置运行环境 1.1.1数据预处理数据预处理代码解析 1.1.2数据集划分数据集划分代码说明 1.2数据增强 1.2.1创建带标签的可迭代对象 1.2.2数据预处理与格式化（ms的data格式） 从原始图像数据到 MindSpore 可训练 / 评估的数…...

编程日记 2025/8/1 9:58:50

python打卡day20

特征降维------特征组合（以SVD为例） 知识点回顾： 奇异值的应用： 特征降维：对高维数据减小计算量、可视化数据重构：比如重构信号、重构图像（可以实现有损压缩，k 越小压缩率越高&#…...

编程日记 2025/8/2 12:30:07

2025数维杯数学建模B题完整限量论文：马拉松经济的高质量发展思路探索

2025数维杯数学建模B题完整限量论文：马拉松经济的高质量发展思路探索，先到先得 B题完整论文https://www.jdmm.cc/file/2712066/ 近年来，我国马拉松赛事数量呈现 “ 先井喷、后调整、再复苏 ” 的显著变化。据中国田径协会数据， …...

编程日记 2025/8/2 12:30:04

深入解析WPF中的3D图形编程：材质与光照

引言在Windows Presentation Foundation (WPF) 中创建三维(3D)图形是一项既有趣又具有挑战性的任务。为了帮助开发者更好地理解如何使用WPF进行3D图形的渲染，本文将深入探讨GeometryModel3D类及其相关的材质和光源设置。 1、GeometryModel3D类简介 GeometryMode…...

编程日记 2025/8/2 12:30:02

python格式化小数加不加f的区别

一直好奇这个f是必须加的吗，但是不论是搜索还是ai都给不出准确的回复，就自己测试了一下结论是不带f指定的是总的数字个数，包含小数点前的数字带f的就是仅指小数点后数字个数需要注意的是不带f的话数字是会用科学计数法表示的&#xff…...

编程日记 2025/8/2 12:30:00

【MySQL】存储引擎 - FEDERATED详解

📢博客主页：https://blog.csdn.net/2301_779549673 📢博客仓库：https://gitee.com/JohnKingW/linux_test/tree/master/lesson 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正！ &…...

编程日记 2025/8/2 12:29:58

window 显示驱动开发-线性内存空间段

线性内存空间段是显示硬件使用的经典段类型。线性内存空间段符合以下模型： 它虚拟化位于图形适配器上的视频内存。GPU 直接访问它;也就是说，无需通过页面映射进行重定向。它在一维地址空间中以线性方式进行管理。驱动程序将DXGK_SEGMENTDESCRIPTOR结…...

编程日记 2025/8/2 12:29:56

uniapp-商城-46-创建schema并新增到数据库

在后台页面中，数据管理是关键。最初，数据可能是通过代码硬编码在页面中，但这种方式缺乏灵活性和扩展性。为了适应实际需求，应使用数据库来存储数据，允许用户自行添加和更新信息。通过数据库，后台页面可以动…...

编程日记 2025/8/2 12:29:54

Go语言的宕机恢复，如何防止程序奔溃

Go语言中的panic机制用于处理程序中无法继续执行的严重错误。当程序触发panic时，当前函数的执行会立即停止，程序开始逐层向上回溯调用栈，执行每个函数的defer语句，直到到达recover函数或者程序崩溃退出。通过recover函数&#xff…...

编程日记 2025/8/2 12:29:51

阅文集团C++面试题及参考答案

能否不使用锁保证多线程安全？ 在多线程编程中，锁（如互斥锁、信号量）是实现线程同步的传统方式，但并非唯一方式。不使用锁保证多线程安全的核心思路是避免共享状态、使用原子操作或采用线程本地存储。以下从几个方面详…...

编程日记 2025/8/2 12:29:48

三款实用电脑工具

今天为大家精心推荐三款实用软件，分别是人声伴奏分离软件、文件夹迁移软件和文字转拼音软件。第一款：NovaMSS NovaMSS是一款功能强大的人声伴奏分离软件，它提供社区版和专业版，社区版永久免费。该软件能够一键提取人声、伴奏、…...

编程日记 2025/8/2 12:29:46

【图片识别内容改名】图片指定区域OCR识别并自动重命名，批量提取图片指定内容并重命名，基于WPF和阿里云OCR识别的解决

基于WPF和阿里云OCR的图片区域识别与自动重命名解决方案应用场景电商商品管理：批量处理商品图片，从固定区域识别商品名称、型号、价格等信息，重命名为"商品名称_型号_价格.jpg"格式档案数字化：扫描后的合同、文件等图片，从固定位置识别合同编…...

编程日记 2025/8/2 12:29:43

可再生能源中的隔离栅极驱动器：光伏逆变器的游戏规则改变者

在迈向可持续未来的征程中，可再生能源已成为全球发展的基石。在可再生能源中，太阳能以其可及性和潜力脱颖而出。光伏(PV)逆变器是太阳能系统的核心，它严重依赖先进技术将太阳能电池板的直流电转换为可用的交流电。隔离栅极驱动器就是这样一种…...

编程日记 2025/8/2 12:29:41

解决：EnvironmentNameNotFound: Could not find conda environment？

明明创建了环境却找不到？ conda env list 查看所有环境使用绝对路径激活 conda activate /home/guokaiyin/miniconda3/envs/synthocc...

编程日记 2025/8/2 12:29:39

文章目录

1、tow-stage

R-CNN

Fast R-CNN

Faster R-CNN

Mask R-CNN

2、one-stage

单发多宽检测(SSD)

YOLO

3、参考资料

相关文章：