YOLO11 vs YOLOv10:详细技术对比
选择理想的目标检测模型是一个至关重要的决定,它需要在准确性、速度和部署约束之间取得平衡。本页提供了 Ultralytics YOLO11 和 YOLOv10 之间的全面技术比较,这两种强大的模型都处于计算机视觉的最前沿。虽然 YOLOv10 引入了显著的效率提升,但 Ultralytics YOLO11 代表了 YOLO 架构的顶峰,它提供了卓越的性能、无与伦比的多功能性以及成熟、维护良好的生态系统的显著优势。
Ultralytics YOLO11:最新的技术水平
Ultralytics YOLO11 是 Ultralytics YOLO 系列中最新也是最高级的模型,为实时目标检测和其他应用设定了新的标准。YOLO11 由高度成功的 YOLOv5 和 YOLOv8 模型的创建者编写,专为最大精度、速度和多功能性而设计。
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 建立在经过验证的架构基础上,结合了改进的特征提取网络和优化的检测头,以提供最先进的准确性。YOLO11 的一个关键优势是其令人难以置信的多功能性。与专用模型不同,它是一个多任务强力工具,在一个统一的框架内原生支持物体检测、实例分割、图像分类、姿势估计和旋转框检测 (OBB)。
这种多功能性得到了强大的 Ultralytics 生态系统的支持,该生态系统优先考虑易用性和开发者生产力。借助简单的 Python API 和 CLI、广泛的文档以及与 Ultralytics HUB 等工具的无缝集成,开发者可以比以往更快地从概念走向部署。与像 Transformers 这样更复杂的架构相比,这些模型受益于高效的训练流程、随时可用的预训练权重和更低的内存要求。
优势
- 卓越的性能平衡: 实现了速度和精度之间的卓越权衡,在各种硬件平台上均优于其他模型。
- 无与伦比的通用性: 单个模型系列可以处理五个关键的视觉 AI 任务,从而简化了复杂应用程序的开发。
- 完善的维护生态系统: 以积极的开发、庞大的社区、频繁的更新和全面的资源为后盾,确保可靠性和支持。
- 易用性: 专为简化的用户体验而设计,使初学者和专家都能够以最小的阻力训练和部署模型。
- 训练和部署效率: 针对更快的训练时间和更低的内存使用进行了优化,使其适用于从边缘设备到云服务器的各种硬件。
弱点
- 作为一种最先进的模型,最大的YOLO11变体需要大量的计算资源才能达到最高的精度,但对于其性能级别而言,它们仍然非常高效。
理想用例
YOLO11 集高性能和多功能性于一身,使其成为各种要求严苛的应用的理想选择:
YOLOv10:突破效率边界
YOLOv10 是由清华大学的研究人员推出的一种对象检测模型,它专注于通过消除后处理过程中对非极大值抑制 (NMS) 的需求来优化端到端延迟。
- 作者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 组织: Tsinghua University
- 日期: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 文档: https://docs.ultralytics.com/models/yolov10/
架构和主要特性
YOLOv10 的核心创新是其无 NMS 训练策略,该策略使用一致的双重分配来处理训练期间的冗余预测。这使得模型无需 NMS 步骤即可部署,从而减少了后处理开销并提高了 inference latency。该架构还具有整体效率-精度驱动设计,并具有轻量级分类头等优化,以减少计算负载。
优势
- 无NMS部署: 消除了一个关键的后处理瓶颈,这对于延迟关键型应用非常有益。
- 高效性: 在 FLOPs 和参数数量方面表现出色,使其适用于资源受限的环境。
- 强大的延迟-精度权衡: 在 GPU 上以极低的推理时间实现具有竞争力的精度。
弱点
- 有限的多功能性: YOLOv10 主要设计用于物体检测,缺乏用于分割、姿势估计和分类的内置多任务功能,而这些功能是 YOLO11 中的标准配置。
- 生态系统与支持: 作为一个来自学术机构的研究驱动型模型,它不具备与 Ultralytics 生态系统内的模型相同的持续维护、社区支持或集成工具。
- 可用性: 与 Ultralytics 提供的精简体验相比,将 YOLOv10 集成到生产流水线中可能需要更多的人工。
理想用例
YOLOv10 最适合于目标检测的端到端延迟是最重要因素的专业应用:
- Edge AI: 适用于计算能力有限且对延迟要求极高的设备部署。
- 高吞吐量系统: 需要处理每秒大量帧的实时视频分析等应用。
- 自动无人机: 实现快速物体检测,用于导航和避障。
性能对决:YOLO11 vs. YOLOv10
在性能对比时,很明显两款模型都非常强大,但 YOLO11 在整体平衡性上表现更佳。如下表所示,对于给定的精度水平,YOLO11 模型在 CPU 和 GPU 上始终能实现更快的推理速度。例如,YOLO11l 实现了比 YOLOv10l 更高的 mAP,同时在 T4 GPU 上速度明显更快。此外,YOLO11x 达到了比 YOLOv10x 更高的 mAP,并且具有更快的推理速度。
虽然 YOLOv10 显示出令人印象深刻的参数效率,但 YOLO11 的架构优化提供了更好的实际性能,尤其是在考虑其多任务功能和易于部署时。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
结论:您应该选择哪种模型?
对于绝大多数开发人员、研究人员和企业来说,Ultralytics YOLO11 是推荐的选择。它提供最先进的精度和速度,并具有无与伦比的多功能性,可以处理多个计算机视觉任务。关键优势在于其强大、维护良好的生态系统,该生态系统确保了易用性、高效的训练以及通往生产的顺畅路径。这种整体方法使 YOLO11 不仅仅是一个强大的模型,而且是构建高级 AI 系统的完整解决方案。
YOLOv10 是一款值得称赞的模型,其创新的无 NMS 设计使其成为高度专业化、对延迟敏感的目标检测任务的强大选择。然而,其狭窄的关注点和缺乏全面的支持生态系统使其不太适合通用用途或可能发展到需要额外视觉能力的项目。
如果您有兴趣探索其他先进的模型,您可以在我们的文档中找到更多对比,例如 YOLO11 vs. YOLOv9 和 YOLOv8 vs. YOLOv10。