跳转至内容

PP-YOLOE+ vs. YOLOv8:技术对比

选择最佳的物体检测架构是开发强大的计算机视觉应用的关键一步。这一决定往往需要在推理速度、检测精度和部署灵活性之间进行复杂的权衡。本指南对百度PaddlePaddle 生态系统中的高精度模型PP-YOLOE+Ultralytics 进行了深入的技术比较。 Ultralytics YOLOv8之间进行了深入的技术比较。

PP-YOLOE+:精准PaddlePaddle 生态系统

PP-YOLOE+ 是 PP-YOLOE 的进化版,由百度PaddleDetection团队开发。它是YOLO 系列的重要迭代,专门针对PaddlePaddle 框架进行了优化。它的发布是为了改进以前的最先进(SOTA)基准,主要侧重于优化训练效率和推理精度之间的权衡。

技术细节: 作者:PaddlePaddle 作者
机构: 百度百度
日期: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:https:PaddlePaddle
文档: https:PaddlePaddle

了解更多关于 PP-YOLOE+ 的信息

架构和核心功能

PP-YOLOE+ 采用现代无锚架构,无需为特定数据集计算最佳锚框尺寸,从而简化了训练过程。

  • 骨干网它利用CSPRepResNet 骨干网,将 CSPNet 的梯度流优势与 RepVGG 的重参数化能力相结合。这使得模型在学习丰富特征的训练过程中具有复杂的结构,而在推理过程中具有更简单、更快速的结构。
  • 颈部该模型采用了路径聚合网络(PAN)颈部,以加强不同尺度的特征融合,这对于检测不同大小的物体至关重要。
  • 头部:一项关键创新是高效任务对齐头部(ET-Head)。这种解耦头机制将分类和定位功能分开,利用任务对齐学习(TAL)确保最高置信度分数与最精确的边界框相对应。

优势与局限

优势 PP-YOLOE+ 可在COCO 数据集等标准基准上实现高性能。PP-YOLOE+ 采用了可变焦距损失和分布焦距损失技术,因此在处理类别不平衡和定位模糊性方面的能力令人印象深刻。

弱点 对许多开发者来说,PaddlePaddle 的主要限制在于它对PaddlePaddle 框架的深度依赖。虽然功能强大,但与 PyTorch相比,PaddlePaddle 的全球社区规模较小,这可能会使与依赖标准工具的现有 MLOps 管道的集成变得复杂。此外,PP-YOLOE+ 主要侧重于检测,缺乏更全面的套件中的本地多任务功能。

Ultralytics YOLOv8:多功能和高性能标准

Ultralytics YOLOv8YOLOv8 代表了人工智能模型开发和部署模式的转变。由Ultralytics 设计的 YOLOv8 不仅仅是一个模型,还是一个完整的框架,能够处理从检测到复杂空间分析等各种计算机视觉任务

技术细节: 作者: Glenn Jocher、Ayush Chaurasia 和 Jing QiuGlenn Jocher、Ayush Chaurasia 和 Jing Qiu
机构: Ultralytics Ultralytics
日期: 2023-01-10
GitHub:https:ultralytics
文档: https:yolov8

了解更多关于 YOLOv8 的信息

建筑与生态系统

YOLOv8 在以往YOLO 版本的基础上,改进了C2f 主干网,取代了 C3 模块,提高了梯度流和特征提取效率。

Ultralytics 的优势

YOLOv8 在易用性方面表现出色。Ultralytics Python 软件包只需几行代码就能完成训练、验证和预测。

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100)

这种简便性由一个维护良好的生态系统提供支持。Ultralytics HUB(用于云训练)、TensorBoard(用于可视化)等工具与多种导出格式(包括ONNX、TensorRT 和OpenVINO)的无缝集成让用户受益匪浅。这确保了模型不仅仅是研究成果,而且可以在现实世界中部署

比较分析:指标和性能

在评估这些模型时,除了要考虑最高精度外,还必须考虑效率。下表列出了关键指标的详细比较。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

速度与效率

这些数据凸显了YOLOv8 的卓越效率。数据 YOLOv8n(纳米)模型是边缘人工智能应用的佼佼者,在 T4GPU 上实现了 1.47ms 的出色推理速度,明显快于最小的 PP-YOLOE+t。此外,YOLOv8n 仅需要 3.2M 参数和 8.7B FLOPs,比同类产品轻便得多。

准确性与资源

虽然PP-YOLOE+x的mAP 值略高于 54.7,但却付出了巨大代价:近 1 亿个参数。相比之下 YOLOv8x的mAP 为 53.9,参数(6820 万)减少了约 30%。对于大多数实际应用而言,YOLOv8 的性能更为均衡,既能提供 SOTA 精确度,又不需要大量的计算开销。

内存效率

Ultralytics YOLO 模型因其在训练和推理过程中占用内存少而闻名。与某些transformer模型或重型架构不同,YOLOv8 经过优化,可在消费级硬件上高效运行,从而减少了对昂贵的云计算资源的需求。

理想的使用案例和应用

在这些模式中如何选择,通常取决于项目的具体限制因素。

何时选择YOLOv8

YOLOv8 以其多功能性易用性成为绝大多数开发人员的推荐选择。

  • 边缘部署: YOLOv8n 等轻量级型号非常适合部署在 Raspberry Pi、NVIDIA Jetson 或移动设备上。
  • 多任务管道:如果您的项目需要在跟踪物体的同时进行分割或姿势估计 (如体育分析),YOLOv8 可在一个统一的库中提供所有这些功能。
  • 快速原型开发: 预先训练的权重和简单的应用程序接口使团队能够在数小时内完成从概念到概念验证的转变。
  • 跨平台支持:出色地支持 ONNX, OpenVINO和CoreML 出色支持,确保您的模型在任何地方都能运行。

何时考虑 PP-YOLOE+

PP-YOLOE+仍然是深度融入百度生态系统的用户的有力竞争者。

  • PaddlePaddle 工作流程:已经将PaddlePaddle 套件用于其他人工智能任务的团队会发现 PP-YOLOE+ 可以很自然地融入他们现有的基础设施。
  • 最大理论精度:对于研究竞赛或每一小部分mAP 计数和计算资源无限的情况,最大的 PP-YOLOE+ 模型都能胜任。

结论

PP-YOLOE+ 则以令人印象深刻的精确度数字展示了PaddlePaddle 框架的能力、 Ultralytics YOLOv8对于更广泛的计算机视觉领域来说,是更实用、更强大的解决方案。它将高速度、资源效率和丰富的功能集(包括对分割姿势估计 本地支持)完美地结合在一起,是现代人工智能开发的最佳选择。

YOLOv8 由一个充满活力的开源社区、大量的文档和持续更新提供支持,确保开发人员拥有面向未来的工具,以有效解决现实世界中的问题。

探索其他模型

如果您有兴趣了解物体检测方面的最新进展,请考虑查看这些相关比较:


评论