跳转至内容

YOLOv10:实时目标检测器技术对比

YOLO(You Only Look Once)架构的演进历程,已成为计算机视觉发展史上的标志性叙事。其发展时间线中的两大里程碑是 YOLOv5——作为可靠性与易用性的行业标杆,以及 YOLOv10——后者作为学术突破,致力于消除后处理瓶颈。本指南通过详细的技术对比,帮助开发者为应用场景选择合适工具,同时探讨最新版本YOLO26如何融合两者的优势。

模型起源与规格

在深入探讨性能指标之前,必须先了解每个模型的背景。

YOLOv5
作者:Glenn Jocher
所属机构: Ultralytics
日期:2020-06-26
GitHub:yolov5
文档:YOLOv5

YOLOv10
作者:王晗、陈辉、刘立浩等
所属机构:清华大学
日期:2024-05-23
Arxiv预印本:arXiv:2405.14458
GitHub代码库:THU-MIG/yolov10
文档:YOLOv10

了解更多关于 YOLOv5

性能分析

下表比较了在COCO 上的模型表现,该数据集是物体检测的标准基准测试。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 更少的参数实现更高的平均精度(mAP),凸显其新型架构带来的效率提升。然而,得益于高度优CUDA YOLOv5 GPU 速度YOLOv5 竞争力,尤其在传统硬件上YOLOv5 。

了解更多关于 YOLOv10

架构与设计

YOLOv5:可靠的标准

YOLOv5 改良的CSPNet骨干网络和PANet颈部YOLOv5 它采用标准锚点检测头,需要在后处理阶段进行非最大抑制(NMS)以过滤重复的边界框。

  • 优势:代码库极其成熟,获得广泛的第三方工具支持,并在树莓派等边缘设备上实现稳定部署。
  • 缺点:依赖于NMS,该算法会因场景中物体数量的不同而引入延迟波动。

YOLOv10:NMS先驱者

YOLOv10 通过采用一致性双重分配 YOLOv10 NMS训练YOLOv10 范式转变。该方法使模型能够为每个目标精确预测一个边界框,从而省去了NMS 步骤。

  • 优势: NMS ,在高密度场景中降低推理延迟;高效的秩引导块设计减少了计算冗余。
  • 缺点:较新的架构可能需要针对某些编译器进行特定的导出设置;相较于v5版本,其历史社区支持较少。

NMS瓶颈

非最大抑制(NMS)是过滤重叠边界框的后处理步骤。虽然该方法有效,但其处理过程是顺序的,在CPU上计算成本高昂。正如YOLOv10 YOLO26所做的那样,移除该步骤对于在边缘硬件上实现实时应用至关重要。

生态系统与易用性

对开发者而言,模型所处的生态系统是最关键的因素之一。这正是研究型存储库与生产型平台之间差异所在。

Ultralytics 优势

两种模型均可通过 ultralytics Python ,使他们能够访问一套强大的工具。

代码示例

在模型之间切换就像更改模型名称字符串一样简单。

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)

# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")

理想用例

何时选择 YOLOv5

  • 遗留系统:若您已有的管道是YOLOv5 格式构建的。
  • 最广泛的兼容性:适用于部署在较旧的嵌入式系统上,这些系统可能尚未支持较新的运算符。
  • 社区资源:当您需要访问过去五年间创建的数千个教程和第三方集成时。

何时选择 YOLOv10

  • 高密度检测:在人群计数或交通分析等场景中,NMS 处理NMS 。
  • 严格的延迟限制:实时机器人或自动驾驶领域,其中每毫秒的推理延迟都至关重要。
  • 研究:探索作业策略与架构剪枝领域的最新进展。

终极推荐:YOLO26

YOLOv5 稳定性YOLOv10 NMS推理,而新Ultralytics 这些优势融合于一体,打造出更卓越的框架。

为何升级至YOLO26? YOLO26原生支持端到端训练,沿袭了YOLOv10 开创的NMS设计 YOLOv10 通过强大的Ultralytics 管道进行了增强。

  1. MuSGD优化器:受大型语言模型训练(特别是Moonshot AI的Kimi K2)启发,该优化器确保稳定收敛与更快的训练速度。
  2. 性能:针对边缘计算进行优化 CPU 较上一代提升高达43%
  3. 精度: 采用 ProgLoss和STAL(语义标记对齐损失)机制,显著提升了小型物体检测能力——这通常是早期模型的薄弱环节。
  4. 全面多功能性:不同于YOLOv10 检测的YOLOv10,YOLOv26提供了用于分割姿势估计分类和旋转框检测

对于2026年启动的任何新项目,YOLO26都是推荐选择,它提供了从数据集标注模型导出的最便捷路径。

了解更多关于 YOLO26 的信息

结论

YOLOv5 YOLOv10 都YOLOv10 计算机视觉领域的重要里程碑。 YOLOv5 通过提升可及性与可靠性推动了人工智能的普及,而 YOLOv10 则突破了端到端处理的技术边界。然而该领域发展迅猛。随着YOLO26的发布,开发者无需再Ultralytics 可靠性与NMS的速度之间抉择——YOLO26二者兼得。

对于其他现代替代方案,您也可考虑探索 YOLO11 用于通用视觉任务,或transformer 实时DETR(RT-DETR)进行目标检测。


评论