YOLO11 vs YOLOv5:目标检测中的技术演进
选择合适的物体检测模型是一个至关重要的决定,它需要在准确性、速度和易于部署的需求之间取得平衡。本页面提供了 Ultralytics 的两个具有里程碑意义的模型之间的全面技术比较:最先进的 Ultralytics YOLO11 和被广泛采用的 Ultralytics YOLOv5。虽然 YOLOv5 为其性能和可用性设定了行业标准,但 YOLO11 代表了下一个进化步骤,在强大且用户友好的 Ultralytics 生态系统中,提供了卓越的准确性、增强的多功能性和最新的架构创新。
Ultralytics YOLO11:最新的技术水平
YOLO11 由 Glenn Jocher 和 Jing Qiu 编写,是 Ultralytics YOLO 系列中最新、最先进的模型。它于 2024 年发布,建立在其前身(如 YOLOv8)的强大基础上,为性能和效率树立了新的基准。它的设计不仅用于目标检测,而且还是一个用于多种计算机视觉任务的综合框架。
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 引入了重大的架构改进,包括一个无锚框检测头和一个优化的网络结构。这种现代设计选择通过消除预定义锚框的需求来简化训练过程,从而在不同的数据集上实现更好的泛化。在许多情况下,该模型以更少的参数和计算要求 (FLOP) 实现了比 YOLOv5 更高的 平均精度均值 (mAP),从而证明了卓越的效率。
YOLO11 的一个突出特点是它的多功能性。它是一个统一的框架,原生支持对象检测、实例分割、图像分类、姿势估计和旋转边界框 (OBB)。这种多任务能力使其成为复杂 AI 系统中一个非常强大和灵活的工具。
优势
- 最先进的精度: 与 YOLOv5 相比,提供了明显更高的 mAP 分数,从而建立了新的性能标准。
- 高效率: 通过更高效的架构实现更好的精度,通常需要更少的参数和 FLOPs。
- 无锚框设计: 通过消除对锚框配置的依赖,简化了训练并提高了性能。
- 多任务通用性: 适用于各种视觉任务的单个框架,简化了多方面应用的开发。
- 完善的生态系统: 受益于持续的开发、广泛的文档、强大的社区支持以及与 Ultralytics HUB 等工具的无缝集成,从而实现 MLOps。
- 训练效率: 提供高效的训练流程,并具有易于获得的预训练权重,并且通常比更复杂的架构(如 Transformer)需要更低的内存使用量。
弱点
- 作为一个前沿模型,YOLO11 的大型变体可能需要大量的计算资源,需要现代 GPU 硬件才能获得最佳性能。
理想用例
YOLO11 是需要最高精度和灵活性的新项目的理想选择:
- 高级机器人技术: 适用于在动态环境中进行精确的物体交互和导航。
- 工业自动化: 高精度质量控制和缺陷检测。
- 医疗保健: 协助医学图像分析,用于肿瘤检测等任务。
- 智慧城市: 为 交通管理 和公共安全的复杂系统提供支持。
YOLOv5:已建立且通用的主力
YOLOv5 由 Glenn Jocher 于 2020 年在 Ultralytics 发布,迅速成为世界上最受欢迎的目标检测模型之一。它以其卓越的速度和准确性、易用性以及在 PyTorch 中强大且有据可查的实现而备受赞誉。
- 作者: Glenn Jocher
- 组织: Ultralytics
- 日期: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- 文档: https://docs.ultralytics.com/models/yolov5/
架构和主要特性
YOLOv5 使用基于 CSPDarknet53 主干网络和 PANet neck 的架构,以实现有效的特征聚合。它的检测头是 基于 anchor 的,这在当时是一种标准且有效的方法。YOLOv5 最大的优势之一是其可扩展性,它提供从微小的“n”(纳米)版本到大型“x”(超大)版本的各种模型,使开发人员可以轻松地在速度和准确性之间进行权衡。
优势
- 卓越的推理速度: 针对实时性能进行了高度优化,使其成为 边缘设备(如 NVIDIA Jetson)上的应用的理想选择。
- 易用性: 以其简单的 API、丰富的教程以及简化的训练和部署工作流程而闻名。
- 成熟的生态系统: 拥有庞大的社区、多年的积极开发和无数的实际部署的支持,确保了稳定性和可靠性。
- 灵活性: 广泛的模型尺寸使其几乎可以适应任何硬件约束。
弱点
- 准确率较低: 虽然仍然强大,但其准确率已被像 YOLO11 这样的较新模型超越。
- 基于Anchor的检测: 依赖于预定义的anchor框,与现代无anchor检测器相比,有时可能需要手动调整,才能在自定义数据集上获得最佳性能。
理想用例
在特定情况下,YOLOv5 仍然是一个极佳的选择:
- 边缘计算: 在资源受限的设备(如 Raspberry Pi)上部署,其中推理速度是首要考虑因素。
- 快速原型设计: 它的简单性和速度使其非常适合快速构建和测试概念验证应用程序。
- 遗留系统: 维护或更新基于 YOLOv5 框架构建的现有项目。
- 实时监控: 为高 FPS 至关重要的安全系统提供支持。
性能与基准测试:YOLO11 vs. YOLOv5
性能指标清楚地说明了从 YOLOv5 到 YOLO11 的演变。在 COCO 数据集上,YOLO11 模型始终比其类似大小的 YOLOv5 同类产品获得更高的 mAP 分数。例如,YOLO11m 达到 51.5 mAP,明显优于 YOLOv5m 的 45.4 mAP。此外,YOLO11 通常以更高的计算效率做到这一点。值得注意的是,最小的模型 YOLO11n 在 CPU 上的速度比 YOLOv5n 快,同时 mAP 大幅提高了 11.5 个百分点。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
结论:您应该选择哪种模型?
YOLO11 和 YOLOv5 之间的选择取决于您项目的具体需求。
YOLOv5 是一个经过验证的、可靠且速度极快的模型。对于那些将速度作为绝对优先级的应用来说,它仍然是一个绝佳的选择,尤其是在较旧或资源有限的硬件上。它的成熟性和庞大的社区支持为许多项目提供了一个稳定的基础。
然而,对于几乎所有新项目,YOLO11是明确且推荐的选择。它代表着一个重大的飞跃,提供了最先进的准确性、卓越的效率和无与伦比的通用性。其无锚框架构和对多个视觉任务的本机支持使其成为一个更强大、更灵活和面向未来的解决方案。通过选择YOLO11,开发者可以利用AI领域的最新进展来构建更强大、更准确的计算机视觉应用程序,同时受益于精简且维护良好的Ultralytics生态系统。
探索其他模型对比
如果您想了解这些模型与其他领先架构的对比情况,请查看我们的其他对比页面: