跳转至内容

YOLO11 vs YOLOv5:目标检测中的技术演进

选择合适的物体检测模型是一个至关重要的决定,它需要在准确性、速度和易于部署的需求之间取得平衡。本页面提供了 Ultralytics 的两个具有里程碑意义的模型之间的全面技术比较:最先进的 Ultralytics YOLO11 和被广泛采用的 Ultralytics YOLOv5。虽然 YOLOv5 为其性能和可用性设定了行业标准,但 YOLO11 代表了下一个进化步骤,在强大且用户友好的 Ultralytics 生态系统中,提供了卓越的准确性、增强的多功能性和最新的架构创新。

Ultralytics YOLO11:最新的技术水平

YOLO11 由 Glenn Jocher 和 Jing Qiu 编写,是 Ultralytics YOLO 系列中最新、最先进的模型。它于 2024 年发布,建立在其前身(如 YOLOv8)的强大基础上,为性能和效率树立了新的基准。它的设计不仅用于目标检测,而且还是一个用于多种计算机视觉任务的综合框架。

架构和主要特性

YOLO11 引入了重大的架构改进,包括一个无锚框检测头和一个优化的网络结构。这种现代设计选择通过消除预定义锚框的需求来简化训练过程,从而在不同的数据集上实现更好的泛化。在许多情况下,该模型以更少的参数和计算要求 (FLOP) 实现了比 YOLOv5 更高的 平均精度均值 (mAP),从而证明了卓越的效率。

YOLO11 的一个突出特点是它的多功能性。它是一个统一的框架,原生支持对象检测实例分割图像分类姿势估计旋转边界框 (OBB)。这种多任务能力使其成为复杂 AI 系统中一个非常强大和灵活的工具。

优势

  • 最先进的精度: 与 YOLOv5 相比,提供了明显更高的 mAP 分数,从而建立了新的性能标准。
  • 高效率: 通过更高效的架构实现更好的精度,通常需要更少的参数和 FLOPs。
  • 无锚框设计: 通过消除对锚框配置的依赖,简化了训练并提高了性能。
  • 多任务通用性: 适用于各种视觉任务的单个框架,简化了多方面应用的开发。
  • 完善的生态系统: 受益于持续的开发、广泛的文档、强大的社区支持以及与 Ultralytics HUB 等工具的无缝集成,从而实现 MLOps。
  • 训练效率: 提供高效的训练流程,并具有易于获得的预训练权重,并且通常比更复杂的架构(如 Transformer)需要更低的内存使用量。

弱点

  • 作为一个前沿模型,YOLO11 的大型变体可能需要大量的计算资源,需要现代 GPU 硬件才能获得最佳性能。

理想用例

YOLO11 是需要最高精度和灵活性的新项目的理想选择:

  • 高级机器人技术: 适用于在动态环境中进行精确的物体交互和导航。
  • 工业自动化: 高精度质量控制和缺陷检测。
  • 医疗保健: 协助医学图像分析,用于肿瘤检测等任务。
  • 智慧城市:交通管理 和公共安全的复杂系统提供支持。

了解更多关于 YOLO11 的信息

YOLOv5:已建立且通用的主力

YOLOv5 由 Glenn Jocher 于 2020 年在 Ultralytics 发布,迅速成为世界上最受欢迎的目标检测模型之一。它以其卓越的速度和准确性、易用性以及在 PyTorch 中强大且有据可查的实现而备受赞誉。

架构和主要特性

YOLOv5 使用基于 CSPDarknet53 主干网络和 PANet neck 的架构,以实现有效的特征聚合。它的检测头是 基于 anchor 的,这在当时是一种标准且有效的方法。YOLOv5 最大的优势之一是其可扩展性,它提供从微小的“n”(纳米)版本到大型“x”(超大)版本的各种模型,使开发人员可以轻松地在速度和准确性之间进行权衡。

优势

  • 卓越的推理速度: 针对实时性能进行了高度优化,使其成为 边缘设备(如 NVIDIA Jetson)上的应用的理想选择。
  • 易用性: 以其简单的 API、丰富的教程以及简化的训练和部署工作流程而闻名。
  • 成熟的生态系统: 拥有庞大的社区、多年的积极开发和无数的实际部署的支持,确保了稳定性和可靠性。
  • 灵活性: 广泛的模型尺寸使其几乎可以适应任何硬件约束。

弱点

  • 准确率较低: 虽然仍然强大,但其准确率已被像 YOLO11 这样的较新模型超越。
  • 基于Anchor的检测: 依赖于预定义的anchor框,与现代无anchor检测器相比,有时可能需要手动调整,才能在自定义数据集上获得最佳性能。

理想用例

在特定情况下,YOLOv5 仍然是一个极佳的选择:

  • 边缘计算: 在资源受限的设备(如 Raspberry Pi)上部署,其中推理速度是首要考虑因素。
  • 快速原型设计: 它的简单性和速度使其非常适合快速构建和测试概念验证应用程序。
  • 遗留系统: 维护或更新基于 YOLOv5 框架构建的现有项目。
  • 实时监控: 为高 FPS 至关重要的安全系统提供支持。

了解更多关于 YOLOv5 的信息

性能与基准测试:YOLO11 vs. YOLOv5

性能指标清楚地说明了从 YOLOv5 到 YOLO11 的演变。在 COCO 数据集上,YOLO11 模型始终比其类似大小的 YOLOv5 同类产品获得更高的 mAP 分数。例如,YOLO11m 达到 51.5 mAP,明显优于 YOLOv5m 的 45.4 mAP。此外,YOLO11 通常以更高的计算效率做到这一点。值得注意的是,最小的模型 YOLO11n 在 CPU 上的速度比 YOLOv5n 快,同时 mAP 大幅提高了 11.5 个百分点。

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

结论:您应该选择哪种模型?

YOLO11 和 YOLOv5 之间的选择取决于您项目的具体需求。

YOLOv5 是一个经过验证的、可靠且速度极快的模型。对于那些将速度作为绝对优先级的应用来说,它仍然是一个绝佳的选择,尤其是在较旧或资源有限的硬件上。它的成熟性和庞大的社区支持为许多项目提供了一个稳定的基础。

然而,对于几乎所有新项目,YOLO11是明确且推荐的选择。它代表着一个重大的飞跃,提供了最先进的准确性、卓越的效率和无与伦比的通用性。其无锚框架构和对多个视觉任务的本机支持使其成为一个更强大、更灵活和面向未来的解决方案。通过选择YOLO11,开发者可以利用AI领域的最新进展来构建更强大、更准确的计算机视觉应用程序,同时受益于精简且维护良好的Ultralytics生态系统。

探索其他模型对比

如果您想了解这些模型与其他领先架构的对比情况,请查看我们的其他对比页面:



📅 1 年前创建 ✏️ 1 个月前更新

评论