YOLOv10 vs YOLO11:对象检测技术对比
选择最佳目标检测模型是一个关键的决策,它需要在准确性、速度和部署约束之间取得平衡。本页提供了 YOLOv10(一种专注于端到端效率的模型)和 Ultralytics YOLO11(Ultralytics 最新的最先进模型,以其多功能性、性能和易用性而闻名)之间的全面技术比较。我们将深入研究它们的架构差异、性能基准和理想应用,以帮助您做出明智的选择。
YOLOv10:突破效率的界限
作者: Ao Wang, Hui Chen, Lihao Liu, 等。
组织: 清华大学
日期: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
文档: https://docs.ultralytics.com/models/yolov10/
YOLOv10 是于 2024 年 5 月推出的对象检测模型,它优先考虑实时端到端性能。它的主要创新是消除了后处理过程中对 非极大值抑制 (NMS) 的需求,而这通常会增加 推理延迟。这是通过一种称为一致双重分配的新型训练策略来实现的。
架构和主要特性
YOLOv10 的设计理念是以整体方法提升效率和准确性。它引入了几项架构优化,以减少计算冗余并提高模型的能力。主要功能包括轻量级分类头和空间通道解耦的降采样策略,以更有效地保留信息。通过移除 NMS 步骤,YOLOv10 旨在简化部署流程并降低延迟,使其成为真正的端到端检测器。
优势
- 增强的效率: 在延迟-准确性和大小-准确性的权衡方面表现出令人印象深刻的性能,尤其是在资源受限的环境中。
- 无NMS设计: 消除NMS后处理步骤简化了部署并减少了端到端推理时间。
- 前沿研究: 通过解决后处理瓶颈问题,代表了对实时对象检测的重大学术贡献。
弱点
- 较新的模型: 作为一个大学研究团队最近发布的版本,与成熟的 Ultralytics 生态系统相比,它的社区规模较小,第三方集成也较少。
- 任务专业化: YOLOv10 主要专注于目标检测。它缺乏对其他视觉任务(如分割、分类和姿势估计)的内置多功能性,而这些是 YOLO11 原生的。
- 生态系统集成: 虽然建立在Ultralytics框架之上,但与Ultralytics直接开发和维护的模型相比,它可能需要额外的精力才能集成到全面的MLOps工作流程中。
理想用例
YOLOv10 特别适合于低延迟和计算效率是最高优先级的应用:
- Edge AI: 非常适合在计算能力有限的设备上部署,例如移动电话和 NVIDIA Jetson 或 Raspberry Pi 上的嵌入式系统。
- 高速处理: 适用于需要极快推理的应用,例如自动驾驶无人机和机器人技术。
- 实时分析: 非常适合需要立即进行目标检测的快节奏环境,例如交通管理。
Ultralytics YOLO11:通用性和性能的尖端
作者: Glenn Jocher、Jing Qiu
组织: Ultralytics
日期: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11是Ultralytics YOLO系列中的最新演进,它建立在YOLOv8等广受欢迎的模型的成功之上。它旨在提供最先进的精度和卓越的性能平衡,同时还非常易于使用和集成。YOLO11不仅仅是一个目标检测器,它还是一个全面的视觉AI框架。
架构和主要特性
YOLO11 具有高度优化的架构,具有先进的特征提取和简化的网络设计。与之前的版本相比,这通常会带来更高的准确性,并且参数数量更少。YOLO11 的一个主要优势在于其多功能性。它原生支持各种任务,包括目标检测、实例分割、图像分类、姿势估计和旋转框 (OBB)。
这种多功能性得到了维护良好的生态系统的支持。Ultralytics 通过简单的 Python API 和 CLI、广泛的文档以及与 Ultralytics HUB 等工具的无缝集成,为无代码训练和部署提供了简化的用户体验。该模型受益于高效的训练流程、随时可用的预训练权重、积极的开发和强大的社区支持。此外,YOLO11 模型在设计上注重效率,与其他许多架构(尤其是基于 Transformer 的模型)相比,在训练和推理期间需要更低的内存。
优势
- 顶尖性能: 以速度和精度的出色平衡实现了顶级的 mAP 分数。
- 多功能和多任务: 单个模型框架可以处理检测、分割、分类、姿势估计和 OBB,为复杂的项目提供无与伦比的灵活性。
- 易用性: 简单、直观的 API 和全面的文档使初学者和专家都可以轻松上手。
- 稳健的生态系统: 受益于积极的开发、频繁的更新、强大的社区支持以及与 Ultralytics HUB 等 MLOps 工具的无缝集成。
- 训练和部署效率: 提供高效的训练工作流程、更低的内存要求,并针对从边缘设备到云服务器的各种硬件进行了优化。
弱点
- 作为一种单阶段检测器,与一些专门的两阶段检测器相比,它在处理极小物体时可能会面临挑战。
- 较大的模型虽然非常准确,但需要大量的计算资源来进行训练和部署。
理想用例
YOLO11 结合了高性能、多功能性和易用性,使其成为广泛的实际应用的理想选择:
- 工业自动化: 适用于制造业中的高精度质量控制和过程监控。
- 医疗保健: 在医学图像分析中,用于肿瘤检测或细胞分割等任务。
- 安全和监控: 通过实时威胁检测和跟踪为高级安全系统提供支持。
- 零售分析: 改善库存管理并分析客户行为。
- 多任务项目: 非常适合需要同时进行目标检测、分割和姿势估计的应用,例如高级驾驶员辅助系统。
性能对比:YOLOv10 vs. YOLO11
在直接比较这些模型时,我们观察到明显的权衡。YOLOv10 模型,尤其是较小的变体,专为实现极高的效率而设计,通常具有更少的参数和 FLOPs。这使得它们成为对延迟要求严苛的任务的有力竞争者。
然而,YOLO11 展示了更强大和更均衡的性能。它在大多数模型尺寸上实现了略高的 mAP,并且在 CPU 和 GPU(T4 TensorRT)上都显示出明显更快的推理速度。这种卓越的速度与精度平衡,加上其多任务功能和成熟的生态系统,使 YOLO11 成为大多数开发和部署场景中更实用和更强大的选择。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
结论:您应该选择哪种模型?
YOLOv10 和 YOLO11 都是强大的模型,它们突破了目标检测的界限。
YOLOv10 是研究人员和开发人员的绝佳选择,他们专注于专门的、对延迟要求严苛的应用程序,其中无 NMS 架构提供了明显的优势。其精简的设计使其非常适合在高度受限的边缘设备上部署。
然而,对于绝大多数开发者、研究人员和商业应用来说,Ultralytics YOLO11是推荐的选择。它在准确性方面的轻微优势和卓越的推理速度提供了更好的整体性能平衡。更重要的是,YOLO11在多个视觉任务中的无与伦比的通用性,加上其易用性和强大、维护良好的Ultralytics生态系统,显着加速了开发并简化了部署。活跃的社区、广泛的文档以及与Ultralytics HUB等工具的无缝集成使YOLO11不仅仅是一个模型,而是构建高级视觉AI应用程序的完整解决方案。
如果您正在探索其他模型,请考虑查看 YOLOv9 vs YOLO11 或 YOLOv8 vs YOLO11 之间的比较,以了解其发展历程并找到最适合您项目的模型。