YOLO系列发展历程:从YOLOv1到YOLO11,目标检测技术的革新与突破
文章目录
- 前言
- 一、YOLOv1:单阶段目标检测的开端
- 二、YOLOv2:更精准的实时检测
- 三、YOLOv3:阶梯特征融合
- 四、YOLOv4:性能和速度的新平衡
- 五、YOLOv5:易用性和扩展性的加强
- 六、YOLOv6:工业部署的利器
- 七、YOLOv7:轻量化与精度的平衡
- 八、YOLOv8:改装复杂场景
- 九、YOLOv9:自动化训练与优化
- 十、YOLOv10:超大规模模型的挑战
- 十一、YOLO11:下一代目标检测
- 总结
前言
**YOLO(You Only Look Once)**系列模型无疑是目标检测领域的一座里程碑,自2016年首次提出以来,便在目标检测领域掀起了一场革命。从YOLOv1的开创性提出,到YOLO11的不断迭代升级,该系列模型持续突破自我,引领着目标检测技术的发展潮流。
一、YOLOv1:单阶段目标检测的开端
YOLOv1是2015年Joseph Redmon 及其团队推出,首次将目标检测视为单一的回归问题,通过神经网络直接预测目标的边界框和类别概率,其速度快、网络结构简单,这一检测模型彻底颠覆了传统检测方法的框架。
YOLOV1将图像划分为网格进行检测,检测精度上较低,特别是在小目标和密集目标的场景中性能较差。
- 参考论文:You Only Look Once: Unified, Real-Time Object Detection
- 论文链接:https://arxiv.org/abs/1506.02640
二、YOLOv2:更精准的实时检测
2016年,由原班人马推出YOLOv2,其改进了YOLOv1的不足,引入批量归一化(Batch Normalization)锚框、维度聚类等,增强了模型的泛化能力以及使用基于K均值的框图设计,YOLOv2在性能上有了显著提升。
但YOLOv2没有进行多尺度特征的结合预测,而且依旧无法检测到非常小的目标。更多技术的引入虽然提升了性能,但增加了复杂性。
- 参考论文:YOLO9000: Better, Faster, Stronger
- 论文链接:https://arxiv.org/abs/1612.08242
三、YOLOv3:阶梯特征融合
Joseph Redmon 和 Ali Farhadi在2018年推出YOLOv3,YOLOv3在前两代的基础上,通过引入多维度检测策略和Darknet-53骨干网络,显著提升了对小目标的检测能力,同时还利用特征金字塔网络(FPN),在不同的测量上进行预测,支持多标签分类任务。
但其模型尺寸急剧增大,难以在嵌入式设备上安装。而且在高密度目标场景下,检测精度容易缺失。
- 参考论文:YOLOv3: An Incremental Improvement
- 论文链接:https://arxiv.org/abs/1804.02767
四、YOLOv4:性能和速度的新平衡
2020年,Alexey Bochkovskiy等发布YOLOv4模型,大量优化实现了性能与速度的最佳平衡。引入CSPDarknet53和多种增强技术(Mosaic数据增强、DropBlock正则化等),使其在COCO数据集上达到了SOTA性能,使其更高效且更适合单GPU训练,包括CBN、PAN、SAM等。
尽管YOLOV4在多尺度特征融合方面有所改进,但在检测极小目标时仍可能存在一定的局限性。
- 参考论文:YOLOv4: Optimal Speed and Accuracy of Object Detection
- 论文链接:https://arxiv.org/abs/2004.10934
五、YOLOv5:易用性和扩展性的加强
YOLOv5是第一个非原YOLO创始团队推出,而是由Ultralytics于2020年推出的模型,因其提供了轻量化模型和大规模模型的多种版本(n、s、m、l、x),易于部署和集成自动化训练工具,YOLOv5赢得了业界的广泛赞誉与青睐,而且YOLOv5 相较于第四版,无论是学习率调整、运行效率方面还是模型精度、速度都有显著提升。
但其对于小目标、密集物体检测方面还有待提升,在复杂场景下,可能会出现误检和漏检的情况。
- 参考论文:Improved YOLOv5 network for real-time multi-scale traffic sign detection
- 论文链接:https://arxiv.org/abs/2112.08782
六、YOLOv6:工业部署的利器
YOLOv6是在2022年由国内科技公司美团研发,其更专注于工业场景的实际需求,YOLOv6在速度和精度之间达到了较好的权衡,支持自定义部署,适合资源设定的环境,改进了损失函数设计,提升了检测效果。
在光照、姿态等条件变化较大的场景下,检测精度可能会下降。部分针对特定硬件平台优化,泛用性稍弱。
- 参考论文:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
- 论文链接:https://arxiv.org/abs/2209.02976
七、YOLOv7:轻量化与精度的平衡
YOLOv7是由YOLOv4团队进行研发推出,该版本实现了轻量化网络结构的设计,提出了动态标签分配机制,优化了目标框匹配,在速度和精度上都超过所有(此版本以前)已知的目标检测器。
但在针对增加的数据集需要大量的训练时间,以及在某些复杂场景下或对小目标的检测效果可能不如其他算法。
- 参考论文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
- 论文链接:https://arxiv.org/abs/2207.02696
八、YOLOv8:改装复杂场景
YOLOv8依旧是由Ultralytics公司在2023年发布,在复杂场景下表现优异,引入新的注意力机制和数据增强策略,支持全方位的视觉 AI 任务,使得用户可以在各个应用和领域中利用YOLOv8的功能。
尽管进行了优化,但高性能的模型仍需要较大的计算资源。复杂的网络结构和多个模块增加了模型的复杂度和训练难度。
- 参考文档:https://docs.ultralytics.com/models/yolov8/
九、YOLOv9:自动化训练与优化
2023年,中国台湾 Academia Sinica、台北科技大学等机构联合开发YOLOv9此次改进是基于YOLOv7的基础上,增强了自动化和模型自适应能力,使用AutoML技术实现模型结构和超参数的自动搜索,两者结合设计在深度模型的参数数量、计算量等方面都比YOLOv8由所减少。
但AutoML的引入增加了模型开发的时间成本,对于极端复杂或遮挡严重的目标,检测效果可能受到影响。
- 参考论文:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
- 论文链接:https://arxiv.org/abs/2402.13616
十、YOLOv10:超大规模模型的挑战
YOLOv10在2024年由清华大学开源,针对超大规模模型进行了优化,提出NMSfree(非极大值抑制)训练的一致双分配,实现了高效的端到端检测。引入了整体效率精度驱动的模型设计策略。
虽然进行了轻量化设计,但相对于一些更简单的模型来说,YOLOV10的复杂度仍然较高。
- 参考论文:YOLOv10: Real-Time End-to-End Object Detection
- 论文链接:https://arxiv.org/abs/2405.14458
十一、YOLO11:下一代目标检测
YOLO11是Ultralytics推出的最新一代计算机视觉模型,代表了目标检测领域的最新进展,采用全新的Transformer架构,支持多模态输入,并提供了灵活的部署方案,它在对象检测、实例分割、图像分类、姿势估计、定向物体检测和对象跟踪等计算机视觉任务上展现了卓越的性能和准确性,相较于YOLOv8有了显著提升。
- 官网源码下载地址:https://github.com/ultralytics/ultralytics
总结
总结而言,YOLO系列模型在目标检测领域不断刷新纪录,从精度到效率均取得了显著成就。尽管每一代模型都有其局限性,但它们的创新推动了整个领域的发展。
值得一提的是,Coovally模型训练平台不仅包含YOLOv3、YOLOv5、YOLOv8等热门算法,最新发布的YOLO11算法平台也已上线。
无论你是初学者还是经验丰富的开发者,都可以在这里轻松尝试和体验YOLO系列模型的强大功能。
欢迎大家使用Coovally平台,探索目标检测的无限可能!后续将对YOLO系列算法进行详细解读,并进行案例分析
相关文章:
YOLO系列发展历程:从YOLOv1到YOLO11,目标检测技术的革新与突破
文章目录 前言一、YOLOv1:单阶段目标检测的开端二、YOLOv2:更精准的实时检测三、YOLOv3:阶梯特征融合四、YOLOv4:性能和速度的新平衡五、YOLOv5:易用性和扩展性的加强六、YOLOv6:工业部署的利器七、YOLOv7&…...
认识Java中的异常(半成品)
1.异常的概念与体系结构 1.1在Java中,将程序执行过程中发生的不正常行为称为异常.比如 1.算数异常 public class Main1 {public static void main(String[] args){System.out.println(10/0);} } //异常信息为:Exception in thread "main" java.lang.ArithmeticExc…...
Sqoop 指令语法手册
目录 help指令list-databases参数描述示例 codegen参数描述 Sqoop create-hive-table参数描述 eval参数描述 Export参数描述 import参数描述 import-all-tables参数描述 import-mainframe参数描述 job参数描述 list-tables参数描述 merge参数描述 help指令 sqoop help 下面的S…...
网络安全 - SQL Injection
1.1.1 摘要 日前,国内最大的程序员社区CSDN网站的用户数据库被黑客公开发布,600万用户的登录名及密码被公开泄露,随后又有多家网站的用户密码被流传于网络,连日来引发众多网民对自己账号、密码等互联网信息被盗取的普遍担忧。 网络…...
spi 发送与接收 移位写法
spi _tx 发送模块 片选信号cs可以在top顶层控制模块产生 timescale 1ns / 1psmodule spi_rom#(parameter SIZE 8 )(input wire clk ,input wire rst_n,input wire [SIZE-1:0] data ,input wire …...
MyBatis关联映射
目录 一、什么是关联注解? 二、数据库建表 1.学生表 2.教师表 三、一般查询 (1)创建StudentTeacher类 (2)mapper层 (3)Dao接口 (4)Test类 (5&#x…...
通过华为鲲鹏认证的软件产品如何助力信创产业
软件通过华为鲲鹏认证与信创产业有着密切的联系。鲲鹏认证是华为推动信创产业发展的一项重要举措,通过该认证,软件可以在华为的生态系统中实现更好的兼容性和性能优化,从而推动信创产业的全面发展和国产化替代。 鲲鹏认证的定义和重要性 鲲…...
陈志刚解读:国家数据基础设施建设解读(附下载)
本期分享陈志刚解读:国家数据基础设施建设解读,从背景意图、概念内涵、发展愿景与总体功能、总体架构、重点方向、算力底座、网络支撑、安全防护和组织保障十个方面展开,共52页ppt。 加入星球可获取完整版资料 篇幅限制,部分内容…...
QT 中 sqlite 数据库使用
一、前提 --pro文件添加sql模块QT core gui sql二、使用 说明 --用于与数据库建立连接QSqlDatabase--执行各种sql语句QSqlQuery--提供数据库特定的错误信息QSqlError查看qt支持的驱动 QStringList list QSqlDatabase::drivers();qDebug()<<list;连接 sqlite3 数据库 …...
VPN设备
定义: 虚拟专用网络指的是在公用网络上建立专用网络的技术。之所以称为虚拟网主要是因为整个VPN网络的任意两个节点之间的连接并没 有传统专网所需的端到端的物理链路,而是架构在公用网络服务商所提供的网络平台之上的逻辑网络,用户数据在逻辑链路中传输…...
centos部署SkyWalking并在springcloud项目中用法举例
文章目录 场景SkyWalking介绍部署部署Storage [单机版Elasticsearch]部署SkyWalking OAP [下载地址](https://skywalking.apache.org/downloads/#SkyWalkingAPM)部署SkyWalking Java AgentspringCloud 使用举例 场景 SkyWalking是应用性能监控平台,可用于分布式系统…...
[创业之路-186]:《华为战略管理法-DSTE实战体系》-1-为什么UTStarcom死了,华为却活了,而且越活越好?
目录 前言 一、市场定位与战略选择 二、技术创新能力 三、企业文化与团队建设 四、应对危机的能力 五、客户为中心的理念 六、市场适应性与战略灵活性 七、技术创新与研发投入 八、企业文化与团队建设 九、应对危机的能力 前言 UT斯达康(UTStarcom&#…...
算法设计5_分支限界法
分支限界法 分支限界法常以广度优先或以最小耗费(最大效益)优先的方式搜索问题的解空间树,裁剪那些不能得到最优解的子树以提高搜索效率。 步骤: ① 定义解空间(对解编码); ② 确定解空间的树结构; ③ 按BFS等方式搜索: a.每个活…...
【设计模式系列】状态模式(二十三)
一、什么是状态模式 状态模式(State Pattern)是一种行为设计模式,其核心目的是管理一个对象在其内部状态改变时的行为变化,其核心理念是将对象的行为和状态分离。这种模式通过将每个状态相关的行为封装在独立的类中,使…...
github创建发布分支
创建一个名为 latest 的分支,并将其作为稳定版本分支。以下是操作步骤: 1. 创建 latest 分支 首先,确保你在 master 分支(或当前的稳定版本分支)上,并且已经提交了所有更改。然后,你可以创建一…...
【Linux】网络服务
声明,以下内容均学习自《Linux就该这么学》一书 1、创建网络会话 Linux系统使用NetworkManager提供网络服务,它是一种动态管理网络配置的守护进程,能够让网络设备保持连接状态。 nmcli nmcli是一款基于命令行的网络配置工具,它…...
错题:Linux C语言
题目:手写代码:判断一个数(int类型的整数)中有有多少1 题目:手写代码:判断一个数(转换成二进制表示时)有几个1 #include <stdio.h> int main(int argc, const char *argv[]) { //判断一个数…...
机器学习期末速成
文章参考自B站机器学习期末速成课 本文仅作者个人复习使用 一、机器学习分类 聚类和分类的区别: 分类:一开始就知道有哪些类别 聚类:一开始不知道有哪些类别 损失函数:简单来说就是你预测出来的结果和真实值的差距。 0-1损失函数…...
【学习总结|DAY015】Java面向对象高级-抽象类、接口
引言 在今天的课程中,我们详细探讨了 Java 编程语言的几个核心特性:多态、final 关键字、抽象类和接口。这些概念是面向对象编程的基础,对于构建健壮、可维护的应用至关重要。本文将通过具体的例子和解释帮助大家更好地掌握这些知识点。 一…...
单词拼写纠正-04-161.力扣 相隔为 1 的编辑距离
拼写纠正系列 NLP 中文拼写检测实现思路 NLP 中文拼写检测纠正算法整理 NLP 英文拼写算法,如果提升 100W 倍的性能? NLP 中文拼写检测纠正 Paper java 实现中英文拼写检查和错误纠正?可我只会写 CRUD 啊! 一个提升英文单词拼…...
深入理解 NumPy 广播机制:从基础到应用
目录 什么是广播机制?广播机制的规则广播机制示例1. 一维数组与标量运算2. 二维数组与一维数组运算3. 维度不同的数组运算4. 广播失败的情况 广播机制的实际应用场景1. 数据归一化2. 批量计算欧氏距离 总结广播机制的核心要点: 在使用 NumPy 进行数组操作…...
Springboot(五十三)SpringBoot3整合redisson
前边我们有记录Springboot2/3整合redis的方式。是基于Springboot默认集成的Lettuce客户端实现的。 今天我们在项目中集成的redission是在Lettuce之上构建的redis客户端。 Redisson:一个在Jedis和Lettuce之上构建的Redis客户端。提供了一系列分布式Java对象和服务,比如:分布式…...
UAC2.0 speaker——带反馈端点的 USB speaker(16bit 单声道)
UAC2.0 speaker 系列文章 UAC2.0 speaker——单声道 USB speaker(16bit) UAC2.0 speaker——类特殊请求 UAC2.0 speaker——音量控制 UAC2.0 speaker——多采样率支持 UAC2.0 speaker——24/32bit 支持 UAC2.0 speaker——speaker 数据传输 UAC2.0 speaker——同时支持 16bi…...
P2562 [AHOI2002] Kitty猫基因编码
P1498P2562 [AHOI2002] Kitty猫基因编码 #include <iostream> using namespace std; #include <cmath> #include <vector> #include <string> string encode(string str){if(str.find("0") string::npos) return "B";if(str.fin…...
HarmonyOS(65) ArkUI FrameNode详解
Node 1、Node简介2、FrameNode2.1、创建和删除节点2.2、对FrameNode的增删改2.3 FramNode的查询功能3、demo源码4、总结5、参考资料1、Node简介 在HarmonyOS(63) ArkUI 自定义占位组件NodeContainer介绍了自定义节点复用的原理(阅读本本篇博文之前,建议先读读这个),在Node…...
40分钟学 Go 语言高并发:负载均衡与服务治理
负载均衡与服务治理 一、知识要点总览 模块核心内容技术实现难度负载策略轮询、权重、最小连接数自定义负载均衡器中服务降级服务降级、熔断降级、限流降级Hystrix模式高熔断机制熔断器状态机、失败计数、自动恢复Circuit Breaker高限流设计令牌桶、滑动窗口、计数器Rate Lim…...
Python 从入门到实战45(Pandas数据操作)
我们的目标是:通过这一套资料学习下来,可以熟练掌握python基础,然后结合经典实例、实践相结合,使我们完全掌握python,并做到独立完成项目开发的能力。 上篇文章我们学习了pandas数据读写的相关基础知识。今天学习一下…...
node js 历史版本下载
此为node历史版本下载地址 https://nodejs.org/dist/https://nodejs.org/dist/...
无代码探索AI大模型:腾讯云函数计算的卓越实践
在数字化转型的浪潮中,人工智能(AI)技术已经成为企业提升竞争力的关键。然而,对于许多业务人员来说,技术门槛高、开发周期长等问题限制了他们快速探索和应用AI大模型的能力。同时,对于缺乏GPU资源的开发者来…...
网页数据抓取:融合BeautifulSoup和Scrapy的高级爬虫技术
网页数据抓取:融合BeautifulSoup和Scrapy的高级爬虫技术 在当今的大数据时代,网络爬虫技术已经成为获取信息的重要手段之一。Python凭借其强大的库支持,成为了进行网页数据抓取的首选语言。在众多的爬虫库中,BeautifulSoup和Scra…...
vivado中,generate output product 和Create HDL wrapper的作用
generate output product 以zynq的ip核举例,没有generate output product之前,在ip source 什么也看不到。 但是同样的一个ip核,generate output product之后,会生成综合,布线和仿真文件,约束文件等等。 …...
欧盟R156法规注意事项及实例展示
欧盟 R156 法规即《关于批准车辆的软件升级和软件升级管理体系统一规定的法规》,其注意事项及实例如下: 注意事项: 软件升级管理体系方面: 体系建立与维持:汽车制造商和供应商必须建立完善的软件升级管理体系ÿ…...
HTML语义化的案例分析
HTML语义化的案例分析:对比实际网站中语义化与非语义化标签的差异 在现代Web开发中,HTML语义化被广泛认为是提升网页结构和可访问性的重要做法。HTML语义化不仅仅是为了让代码更清晰,更是为了增强搜索引擎优化(SEO)&a…...
使用 pyperclip 进行跨平台剪贴板操作
简介:pyperclip 是一个轻量级的 Python 库,支持在不同操作系统(Windows、macOS、Linux)中进行剪贴板的复制和粘贴。这个库的设计简单易用,非常适合需要频繁进行文本复制粘贴操作的场景。 历史攻略: 使用f…...
微信小程序报错:http://159.75.169.224:7300不在以下 request 合法域名列表中,请参考文档
要解决此问题,需打开微信小程序开发者工具进行设置,打开详情-本地设置重新运行,该报错就没有啦...
Java:181 基于springboot的考编论坛管理系统
作者主页:舒克日记 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 本系统一共管理员,用户角色。 主要功能:收货地址管理、经验交流平台管理、公告信息管理、跳蚤市场管理、商品留言管理、商品订…...
通义千问sft-甄嬛对话
流程步骤 https://www.datawhale.cn/activity/110/21/76?rankingPage1 按照上面的流程,准备好数据之后就可以直接对7b的模型进行指令微调了,整个流程不是很复杂,操作起来比较方便。但是发布服务等了较长时间,以为出了bug 结果展…...
如何配置Jackson以忽略Java类中为null或空(empty)的字段
Jackson库提供了JsonInclude注解和ObjectMapper配置选项,可以用来控制是否在JSON输出中包含null或空值的字段。 默认情况下,Jackson会包含所有字段,不论其值为何。 本教程将展示如何使用Include.NON_NULL来忽略null值字段,以及使…...
设置笔记本同时连接内外网
原理:通过笔记本和手机相连,实现双网卡功能能。笔记本连接内网wifi、同时手机端开启usb网络共享,笔记本就有了两个网,然配置那个访问外网,那个访问内网。 1.笔记本wifi连接内网wifi 2.手机端共享网络。 手机打开 -【…...
让文章更具说服力:如何巧妙运用逻辑
在写作的过程中,不论是创作小说、撰写学术论文,还是撰写营销文案,逻辑的运用都至关重要。一个没有逻辑支撑的文章,很容易让读者产生困惑、迷失方向,甚至失去阅读兴趣。因此,如何巧妙地运用逻辑,…...
阿里云云服务器Docker-Execrise
申请云服务器 阿里云每个人可以免费申请三个月的使用的服务器可以用作学习使用建议申请规格2核4g的,2g的有点捉襟见肘了选择服务器建议alibaba-linux服务器,就是linux;选择windows可能由于2核4g的限制,docker不匹配系统起码我就是…...
解决 MySQL 启动失败与大小写问题,重置数据库
技术文档:解决 MySQL 启动失败与大小写问题,重置数据库 1. 问题背景 在使用 MySQL 时,可能遇到以下问题: MySQL 启动失败,日志显示 “permission denied” 或 “Can’t create directory” 错误。MySQL 在修改配置文…...
启智畅想集装箱箱号识别算法,2台相机即可实现较高识别率
启智畅想集装箱箱号识别算法,在货车通道中使用时,一般配备2台相机即可。启智畅想集装箱箱号识别算法,在货车通道中使用时,一般配备2台相机即可实现对集装箱箱号的精准捕捉与识别。这两台相机分别安装在货车通道的后侧和随意侧面&a…...
【C++】指针与智慧的邂逅:C++内存管理的诗意
文章目录 RAII 智能指针auto_ptrunique_ptr shared_ptr模拟实现定制删除器循环引用 和 weak_ptr RAII RAII(Resource Acquisition Is Initialization)是一种广泛应用于 C 等编程语言中的编程范式,它的核心思想是:资源的获取和释放…...
python中的高阶函数
1、什么是高阶函数? 高阶函数是指将函数作为参数传入。就是高阶函数 2、高阶函数有哪些? map 映射函数 >>> print(list(map(lambda x:x*x,range(1,11)))) [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] >>> print(list(map(lambda x:st…...
spark关联hive 报 Filesystem Close 错误
请看如下问题: 假如我想将一个sql语句插入hive表中时,比如 insert into table tmp.app_user_active_range partition (dt2022-11-04) 报如下错误: 我的环境是pyspark,pyspark中操作hive,使用datagrip关联spark,在da…...
MySQL主从同步详解
文章目录 MySQL主从同步概述MySQL主从同步原理MySQL主从同步结构模式MySQL主从同步搭建搭建步骤一主一从实验环境master主机slave1主机验证主从同步 一主多从master主机slave2主机验证主从同步 MySQL主从同步复制模式 读写分离技术MaxScale简介部署MaxScale服务器授权用户maste…...
Python 单元测试基础脚本
单元测试的概念: 单元测试是针对程序中最小可测试单元进行检查和验证的过程。在Python中,通常一个函数或方法就是一个测试单元。 unittest框架: Python自带了一个名为unittest的单元测试框架,它受JUnit启发,为开发者提…...
鸿蒙开发-在ArkTS中实现socket功能
基本概念 在 ArkTS 中实现 Socket 功能主要涉及到网络通信中的套接字(Socket)编程。Socket 是一种用于在不同设备(如客户端和服务器)之间进行双向通信的接口,它允许应用程序发送和接收数据。在网络编程中,有两种主要的 Socket 类型:基于 TCP…...
【设计模式系列】策略模式(二十四)
一、什么是策略模式 策略模式(Strategy Pattern)是软件设计模式中的一种行为型模式。它定义了一系列算法,并将每一个算法封装起来,使它们可以互换使用,算法的变化不会影响使用算法的用户。策略模式让算法的变化独立于…...