跳转至内容

YOLO11 vs PP-YOLOE+:详细模型对比

选择合适的物体检测模型是一个至关重要的决定,它需要在准确性、速度和部署效率之间取得平衡。本页全面比较了 Ultralytics YOLO11(来自 Ultralytics 的最新先进模型)和 PP-YOLOE+(来自百度 PaddlePaddle 生态系统的强大模型)。虽然这两个模型都非常强大,但 YOLO11 以其卓越的性能平衡、出色的易用性以及集成到多功能、维护良好的生态系统中而脱颖而出,使其成为各种计算机视觉应用的首选。

Ultralytics YOLO11:最先进的性能和通用性

Ultralytics YOLO11是Ultralytics最新的旗舰模型,由Glenn Jocher和Jing Qiu设计。它于2024年9月27日发布,建立在YOLOv8等非常成功的前辈的基础上,为实时目标检测及其他领域树立了新标准。YOLO11的设计旨在实现最高的效率、通用性和用户友好性,使先进的计算机视觉技术能够为世界各地的开发者和研究人员所用。

作者: Glenn Jocher、Jing Qiu
组织: Ultralytics
日期: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolo11/

架构和主要特性

YOLO11 具有复杂的单阶段 无锚框架构,可优化速度和准确性之间的权衡。其简化的网络设计减少了参数数量和计算负载,从而加快了 推理速度 并降低了内存要求。这种效率使 YOLO11 成为在各种硬件上部署的理想选择,从资源受限的边缘设备(如 NVIDIA Jetson)到强大的云服务器。

YOLO11 最大的优势之一是它的多功能性。它不仅仅是一个目标检测模型,而是一个全面的视觉框架,支持实例分割图像分类姿势估计和旋转框检测 (OBB)。这种多任务能力无缝集成到 Ultralytics 生态系统中,该生态系统以其易用性而闻名。凭借简单的 Python APICLI、广泛的 文档 以及支持性社区,开发人员可以在几分钟内入门。该生态系统还包括 Ultralytics HUB 等工具,用于无代码训练和部署,进一步降低了入门门槛。

优势

  • 卓越的性能平衡: 实现了速度和精度之间的出色权衡,通常以更少的参数优于竞争对手。
  • 卓越的效率: 针对 CPU 和 GPU 上的高速推理进行了优化,并在训练和部署期间降低了内存使用率。
  • 无与伦比的通用性: 单个框架支持各种视觉任务,为复杂的项目提供统一的解决方案。
  • 易用性: 具有简化的用户体验,包括简单的 API、全面的文档和大量的教程。
  • 完善的生态系统: 受益于积极的开发、频繁的更新、强大的社区支持以及与 MLOps 工具的无缝集成。
  • 高效训练: 配备现成的预训练权重和优化的训练程序,从而加快开发周期。

弱点

  • 作为一种单阶段检测器,与专门的两阶段检测器相比,它在密集场景中处理极小物体时可能会面临挑战。
  • 像 YOLO11x 这样的大型模型需要大量的计算资源才能实现实时性能,这是高精度模型的常见特征。

应用案例

YOLO11 兼具速度、准确性和多功能性,使其成为各种要求严苛的应用的理想选择:

了解更多关于 YOLO11 的信息

PP-YOLOE+:PaddlePaddle 生态系统内的高精度

PP-YOLOE+ 是由 百度 开发并于 2022 年发布的 PaddleDetection 套件中的目标检测模型。它是一种无锚框的单阶段检测器,专注于在保持合理效率的同时实现高精度,尤其是在 PaddlePaddle 深度学习框架 内。

作者: PaddlePaddle Authors
机构: Baidu
日期: 2022-04-02
ArXiv: https://arxiv.org/abs/2203.16250
GitHub: https://github.com/PaddlePaddle/PaddleDetection/
文档: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

架构和主要特性

PP-YOLOE+ 还采用了无锚框设计来简化检测头。它的架构通常使用像 CSPRepResNet 这样的骨干网络,并结合了诸如 Varifocal Loss 和高效的 ET-Head 等技术来提高性能。该模型针对 PaddlePaddle 生态系统进行了高度优化,这是其核心设计考虑因素。

优势与劣势

PP-YOLOE+ 是一款强大的执行器,可提供高 mAP 分数,尤其是在其较大的模型变体中。但是,它的主要弱点在于其生态系统依赖性。对于与 PyTorch 合作的绝大多数开发人员和研究人员来说,与 PaddlePaddle 绑定可能会带来巨大的学习曲线和集成挑战。此外,如性能表所示,它的模型通常需要更多的参数和 FLOP 才能达到与 YOLO11 相当的精度,从而降低了计算效率。

应用案例

PP-YOLOE+ 非常适合于以高精度为首要任务且开发环境已经基于 PaddlePaddle 的应用。

  • 工业检测: 检测生产线上的缺陷。
  • 零售: 自动化库存检查和分析。
  • 回收: 识别用于 自动分拣 的材料。

了解更多关于 PP-YOLOE+ 的信息

性能分析:YOLO11 vs. PP-YOLOE+

在比较性能指标时,Ultralytics YOLO11 在效率和速度方面表现出明显的优势,同时提供最先进的准确性。

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
  • 精度与效率: 在相似的模型规模下,YOLO11 始终比 PP-YOLOE+ 实现了更高的 mAP 分数(例如,YOLO11m 与 PP-YOLOE+m)。至关重要的是,它以明显更少的参数和 FLOPs 做到了这一点。例如,YOLO11x 的 mAP 与 PP-YOLOE+x 相匹配,但仅使用了 58% 的参数和更少的 FLOPs,使其成为效率更高的模型。
  • 推理速度: YOLO11 在各个方面都明显更快。在 T4 GPU 上,每个 YOLO11 变体的性能都优于其 PP-YOLOE+ 对应产品。YOLO11 的 CPU 基准测试的可用性进一步突出了其部署灵活性,这是没有专用 GPU 的应用程序的关键优势。

训练、可用性和生态系统

除了原始性能之外,开发者体验是 Ultralytics YOLO11 真正闪光的地方。Ultralytics 生态系统构建在最流行的深度学习框架 PyTorch 之上,确保了庞大的社区、丰富的资源和广泛的硬件支持。训练、验证和部署都简化为简单直观的命令。

相比之下,PP-YOLOE+ 仅限于 PaddlePaddle 框架。虽然功能强大,但这个生态系统不太普及,可能会导致更陡峭的学习曲线、更少的社区贡献资源,以及在与其他工具集成时产生更多摩擦。YOLO11 的训练过程和内存使用也经过了高度优化,从而可以在更广泛的硬件上实现更快的实验和部署。

虽然 PP-YOLOE+ 是一款值得称赞的目标检测模型,但 对于绝大多数用例来说,Ultralytics YOLO11 是更优越的选择。 它提供了更具吸引力的最先进的准确性、卓越的推理速度和出色的计算效率。

YOLO11 的主要优势包括:

  • Better Overall Performance(更好的整体性能): 以更少的计算资源实现更高的准确率。
  • 更强的通用性: 适用于多个视觉任务的单一统一框架。
  • 无与伦比的易用性: 用户友好的 API 和生态系统,可加速开发。
  • 更广泛的社区和支持: 构建于 PyTorch 之上,并由活跃的 Ultralytics 团队和社区提供支持。

对于正在寻找强大、灵活且易于使用的视觉 AI 模型的开发人员和研究人员来说,YOLO11 是明显的赢家,它能够以更快的速度和更高的效率创建尖端应用程序。

探索其他模型

如果您正在探索不同的架构,您可能还会对 Ultralytics 生态系统中提供的其他最先进的模型感兴趣。请查看我们的其他比较页面:



📅 1 年前创建 ✏️ 1 个月前更新

评论