跳转至内容

PP-YOLOE+ 与YOLOv10:综合技术比较

选择正确的物体检测模型是影响计算机视觉系统效率、准确性和可扩展性的关键决策。本详细对比分析了来自百度PaddlePaddle 生态系统的精制无锚检测器PP-YOLOE+YOLOv10YOLOv10是清华大学推出的革命性实时端到端检测器,已完全集成到Ultralytics 生态系统中。

这些模型代表了解决速度与精度权衡问题的两种不同方法。通过研究它们的架构创新、性能指标和理想用例,我们可以提供为您的特定应用选择最佳工具所需的见解。

PP-YOLOE+:精准PaddlePaddle 生态系统

PP-YOLOE+(PracticalPaddlePaddle You Only Look One-level Efficient Plus)是 PP-YOLOE 架构的进化版,旨在提供高精度检测机制。它由百度开发,是 PaddlePaddle框架中的旗舰模型,强调针对硬件环境已预先定义的工业应用进行优化。

作者: PaddlePaddle 作者
机构:百度
日期:2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:PaddleDetection Repository
文档:PP-YOLOE+ 文档

主要建筑特点

PP-YOLOE+ 在结构上进行了多项改进,旨在完善特征表示和定位功能,从而脱颖而出:

  • 无锚机制:利用无锚方法来降低超参数调整的复杂性,并提高对不同物体形状的泛化能力。
  • CSPRepResNet 骨干网:将跨阶段局部 (CSP) 网络与 RepResNet 相结合,提供强大的特征提取功能,在计算负荷与表征能力之间实现平衡。
  • 任务对齐学习(TAL):采用专门的损失函数,动态地将分类分数与定位精度对齐,确保高置信度的检测也是最精确的。
  • 高效探测头(ET-Head):一种精简的检测头,可将分类和回归任务分离开来,从而最大限度地减少干扰并提高收敛速度。

了解更多关于 PP-YOLOE+ 的信息

YOLOv10:NMS 的实时革命

YOLOv10YOLO 代表了YOLO 系列的范式转变。它由清华大学的研究人员开发,通过为NMS 训练引入一致的双重分配,解决了非最大抑制( NMS 的历史瓶颈问题。这使得真正的端到端部署得以实现,并大大减少了推理延迟。

作者:Ao Wang, Hui Chen, Lihao Liu, et al.
组织:清华大学
日期:2024-05-23
ArXiv:https://arxiv.org/abs/2405.14458
GitHub:YOLOv10 Repository
文档:Ultralytics YOLOv10 文档

创新与生态系统整合

YOLOv10 不仅仅是建筑结构的更新,更是一种以效率为导向的整体设计。

  • NMS 训练:通过采用 "一对多 "和 "一对一 "的双重标签分配策略,YOLOv10 实现了丰富的监督和高效的推理,从而消除了对NMS 后处理的需求。这降低了推理延迟和部署复杂性。
  • 整体效率设计:具有轻量级分类头和空间通道解耦下采样功能,可最大限度地保留信息,同时最大限度地减少FLOP
  • Ultralytics 集成:作为Ultralytics 生态系统的一部分,YOLOv10 通过统一的Python API 实现了易用性,使开发人员可以轻松地训练、验证和部署模型。
  • 内存效率:该架构经过优化,可在训练过程中降低内存消耗,与transformer检测器或较早的YOLO 迭代相比,优势明显。

了解有关YOLOv10的更多信息

技术性能分析

以下指标突出显示了两种型号之间的性能差异。YOLOv10 始终表现出卓越的效率,以更少的参数和更低的延迟提供更高的精度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

效率与速度

数据显示 YOLOv10性能平衡方面具有明显优势。

  • 参数效率:与 PP-YOLOE+l (52.9%) 相比,YOLOv10l 实现了更高的mAP (53.3%),而使用的参数仅为 PP-YOLOE+l 的一半(29.5M 对 52.2M)。这使得YOLOv10 的存储和加载速度大大提高。
  • 计算负载: YOLOv10 模型的 FLOPs 数量在可比精度层级中一直较低,从而降低了功耗--这是边缘人工智能设备的关键因素。
  • 推理速度:由于采用了NMS 设计,YOLOv10n 在 T4GPU 上实现了 1.56ms 的超低延迟,超过了最小的 PP-YOLOE+ 变体。

NMS 优势

传统的物体检测器需要使用非最大抑制NMS)来过滤重叠的方框,这一步骤通常速度较慢,而且难以在硬件上进行优化。YOLOv10 完全取消了这一步骤,因此无论检测到多少物体,推理时间都是不变的。

优势与劣势

YOLOv10:现代选择

  • 优势:
    • 易用性:无缝集成到Ultralytics 生态系统中,为培训和部署提供标准化的应用程序接口。
    • 部署速度:真正的端到端架构消除了后处理瓶颈。
    • 资源效率:较低的内存使用率和较少的参数使其成为机器人和移动应用程序等资源受限环境的理想选择。
    • 训练效率:利用随时可用的预训练权重和优化的数据加载器,支持快速训练。
  • 弱点:
    • 作为一种较新的架构,第三方教程生态系统正在迅速发展,但可能比YOLOv5 或YOLOv8 等较早的YOLO 版本要小。

PP-YOLOE+:PaddlePaddle 专家

  • 优势:
    • 高精度:精度极高,尤其是最大的型号(PP-YOLOE+x)。
    • 框架优化:针对已在PaddlePaddle 基础架构中深度投资的用户进行了高度调整。
  • 弱点:
    • 生态系统锁定:主要支持仅限于PaddlePaddle 框架,这对于使用 PyTorch或TensorFlow 的团队来说是个障碍。
    • 重量级:需要更多的计算资源(FLOPs 和 Params),才能达到较新的YOLO 模型的精度。

用例建议

实时应用和边缘计算

适用于要求即时响应时间的应用,如自动驾驶汽车或高速生产线、 YOLOv10是最佳选择。它的低延迟和去除的NMS 步骤确保了确定性推理速度,这对安全关键型系统至关重要。

通用计算机视觉

对于寻求多功能解决方案的开发人员来说,Ultralytics YOLO 型号因其维护良好的生态系统而具有明显的优势。YOLOv10 及其同类产品能够在不同任务detect、segment、姿势估计)之间轻松切换,并导出为ONNX、TensorRT 和CoreML 等格式,因此具有很强的适应性。

具体的工业部署

如果您现有的基础架构完全基于百度的技术栈,PP-YOLOE+ 将提供一个与其他PaddlePaddle 工具完美集成的原生解决方案。然而,对于新项目而言,YOLOv10 的培训效率和较低的硬件成本往往能带来更好的投资回报。

开始使用YOLOv10

体验Ultralytics 模型的易用性。只需几行Python 代码,您就可以加载并运行YOLOv10 预测:

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

这种简单的应用程序接口使研究人员能够专注于数据和结果,而不是模板代码。

结论

虽然 PP-YOLOE+ 在其特定框架内仍然是一个强有力的竞争者、 YOLOv10为更广泛的计算机视觉社区提供了更有吸引力的软件包。YOLOv10 在消除NMS 方面取得了架构上的突破,再加上Ultralytics 生态系统的强大功能,为开发人员提供了一个不仅更快、更轻,而且更易于使用和维护的工具。

对于那些希望走在绝对前沿的人,我们还推荐探索 YOLO11是Ultralytics 最新推出的旗舰机型,它进一步推动了多功能性和高性能在多种视觉任务中的应用。

探索其他模型

通过这些比较,拓宽您对物体检测领域的了解:


评论