YOLOv5 vs YOLO11:技术比较
选择合适的物体检测模型是一个至关重要的决定,它需要在准确性、速度和资源效率的需求之间取得平衡。本页面提供了 Ultralytics 的两个具有里程碑意义的模型之间的详细技术比较:被广泛采用的 Ultralytics YOLOv5 和最先进的 Ultralytics YOLO11。虽然 YOLOv5 为性能和易用性设定了行业标准,但 YOLO11 代表了下一个进化,在同一强大的 Ultralytics 生态系统中,提供了卓越的准确性、更大的多功能性和增强的效率。
Ultralytics YOLOv5:已建立的行业标准
YOLOv5 于 2020 年发布,迅速成为世界上最受欢迎的目标检测模型之一。它以速度、可靠性和用户友好性的卓越结合而闻名,使其成为无数开发人员和研究人员的首选。
技术细节:
- 作者: Glenn Jocher
- 组织: Ultralytics
- 日期: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- 文档: https://docs.ultralytics.com/models/yolov5/
架构和主要特性
YOLOv5 构建于 PyTorch 之上,并采用 CSPDarknet53 主干网络,结合 PANet neck 以实现有效的特征聚合。其架构具有高度可扩展性,提供从小型快速的 YOLOv5n 到大型精确的 YOLOv5x 的各种模型。YOLOv5 的一个关键特性是其基于 anchor 的检测头,该检测头在其发布时非常有效。
优势
- 卓越的推理速度: YOLOv5 针对快速推理进行了高度优化,使其成为实时应用的可靠选择,尤其是在 GPU 硬件上。
- 成熟的生态系统: 作为一个完善的模型,YOLOv5 受益于庞大的社区、大量的教程和广泛的第三方支持。它已经在众多的生产环境中经过了实战检验。
- 易用性: YOLOv5 以其简单的 API 和全面的 文档 而闻名,可实现快速原型设计和部署。 该模型已无缝集成到 Ultralytics 生态系统中,包括用于无代码训练的 Ultralytics HUB。
- 训练效率: YOLOv5 提供高效的训练流程,并提供随时可用的预训练权重,从而实现有效的迁移学习和更快的开发周期。
弱点
- 基于 Anchor 的检测: 它对预定义 anchor 框的依赖有时可能需要仔细调整,以便在具有不规则形状对象的数据集上获得最佳性能,这是较新的 无 anchor 检测器 解决的一个限制。
- 精度上限: 虽然仍然非常准确,但其在 COCO 等基准测试中的性能已被 YOLO11 等更新的架构超越。
理想用例
对于速度和稳定性至关重要的应用,YOLOv5 仍然是一个极佳的选择:
- 边缘计算: 其较小的变体非常适合部署在资源受限的设备(如 Raspberry Pi 和 NVIDIA Jetson)上。
- 实时监控: 为需要高 FPS 的安全系统和监控应用程序提供支持。
- 工业自动化: 用于制造环境中的质量控制和过程自动化。
Ultralytics YOLO11:视觉 AI 的下一个进化
YOLO11 是 Ultralytics 的最新技术模型,旨在突破计算机视觉领域可能实现的界限。它建立在其前身(包括 YOLOv8)的成功之上,从而在准确性、速度和多功能性方面实现了显著改进。
技术细节:
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 引入了一种精细的网络架构,具有先进的特征提取功能和简化的设计。一个主要的进步是它的无锚框检测头,它提高了泛化能力并简化了训练过程。这种现代设计使 YOLO11 能够以更高效的参数使用实现更高的准确性,从而加快推理速度并降低计算需求。
优势
- 顶尖性能: YOLO11 树立了新的精度标准,在所有模型尺寸上实现了比 YOLOv5 更高的 mAP 分数。
- 增强的通用性: YOLO11是一个真正的多任务框架,支持物体检测、实例分割、图像分类、姿势估计和旋转框检测(OBB),所有这些都在一个统一的模型中。
- 卓越的效率: 该模型非常高效,可提供更好的速度-精度权衡。值得注意的是,与 YOLOv5 相比,它在 CPU 上的推理速度明显更快,因此可用于更广泛的硬件。与其他许多架构相比,它在训练和推理方面也需要更少的内存。
- 简化的用户体验: 作为 Ultralytics 生态系统的一部分,YOLO11 秉承了对易用性的承诺,提供简单的 Python API、强大的 CLI 和全面的文档。
弱点
- 大型模型的计算需求: 尽管 YOLO11 模型效率很高,但最大的 YOLO11 模型(例如 YOLO11x)仍然需要大量的计算资源才能实现最高的准确率。
- 不断发展的集成: 作为一个较新的模型,第三方工具和集成的生态系统正在迅速增长,但可能尚未像长期建立的 YOLOv5 那样广泛。
理想用例
YOLO11 是需要最高级别精度和灵活性的新项目的理想选择:
- 高级机器人技术: 在复杂的动态环境中实现精确的物体交互和导航。
- 医疗保健和医学影像: 支持诸如肿瘤检测等对高精度要求很高的任务。
- 智慧城市: 为先进的 交通管理 和公共安全系统提供支持。
- 零售分析: 通过更高的精度改善库存管理和客户行为分析。
性能面对面:YOLOv5 vs. YOLO11
性能指标清楚地说明了 YOLO11 所取得的进步。总的来说,YOLO11 模型在保持甚至提高推理速度的同时,显著提高了 mAP。例如,YOLO11s 实现了 47.0 mAP,与 YOLOv5l 相当,但参数少得多,并且 CPU 推理速度明显更快。同样,YOLO11m 在准确性方面超过了 YOLOv5x(51.5 对 50.7 mAP),同时在 CPU 上的速度快了 4 倍以上。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
结论:您应该选择哪种模型?
虽然 YOLOv5 仍然是一个可靠的模型,但 YOLO11 是明显的继任者,也是几乎所有新项目的推荐选择。 它在性能上有了巨大的飞跃,提供了更高的准确性、更大的任务多功能性和更高的效率,而没有牺牲使其前身如此受欢迎的易用性。
-
如果您正在处理已使用 YOLOv5 的遗留项目,或者您的主要限制是在其特定 GPU 速度优化提供关键优势的硬件上进行部署,请选择 YOLOv5。
-
对于任何新应用,请选择 YOLO11。其卓越的精度、无锚框设计、多任务功能以及在 CPU 和 GPU 上的出色性能使其成为更强大、更灵活且面向未来的解决方案。
这两款模型都得到了强大的 Ultralytics 生态系统的支持,通过卓越的支持和文档,确保了流畅的开发体验。
探索其他模型对比
如果您想了解这些模型与其他领先架构的对比情况,请查看我们的其他对比页面: