跳转至内容

PP-YOLOE+ 与 YOLO11:全面技术比较

选择最佳的物体检测模型需要对架构、推理速度和集成能力进行仔细分析。本指南对百度PaddlePaddle 生态系统中的高精度模型PP-YOLOE+ 和 Ultralytics 进行了详细的技术比较。 Ultralytics YOLO11进行了详细的技术比较。这两个框架都具有强大的检测能力,而YOLO11 则通过卓越的计算效率、统一的多任务框架和对开发人员无与伦比的易用性脱颖而出。

PP-YOLOE+:在 PaddlePaddle 生态系统中的高精度

PP-YOLOE+ 是百度研究人员开发的 PP-YOLOE 的演进版本。它是一种无anchor、单阶段目标 detect 器,旨在提高训练收敛速度和下游任务性能。它严格构建于PaddlePaddle 框架内,利用CSPRepResNet骨干网络和动态标签分配策略,在 COCO 等基准测试中实现具有竞争力的精度。

作者: PaddlePaddle 作者
机构:百度
日期: 2022-04-02
预印本:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
文档:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

主要架构特性

PP-YOLOE+ 的架构侧重于优化速度和准确性之间的权衡。它集成了高效任务对齐头 (ET-Head),以更好地平衡分类和定位任务。该模型采用了一种称为任务对齐学习 (TAL) 的标签分配机制,这有助于在训练期间选择高质量的正样本。然而,由于它严重依赖 PaddlePaddle 生态系统,将其集成到 基于 PyTorch 的工作流中通常需要复杂的模型转换过程。

了解更多关于 PP-YOLOE+ 的信息

Ultralytics YOLO11:视觉 AI 的新标准

Ultralytics YOLO11 代表了实时计算机视觉的尖端技术。由 Glenn Jocher 和 Jing Qiu 精心打造,它在 YOLOv8 的成功基础上,提供了一个更快、更准确、效率显著更高的模型。YOLO11 不仅仅是一个目标检测器;它是一个多功能基础模型,能够在统一的代码库中处理实例分割姿势估计图像分类旋转框检测 (OBB)

作者: Glenn Jocher, Jing Qiu
机构:Ultralytics
日期: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
文档:https://docs.ultralytics.com/models/yolo11/

架构与优势

YOLO11 引入了精炼的架构,旨在最大限度地提高特征提取效率,同时最大限度地减少计算开销。它采用增强的骨干网络和头部设计,与前几代模型和 PP-YOLOE+ 等竞争对手相比,减少了总参数数量。这种复杂性的降低使得在边缘设备和云 GPU 上都能实现更快的推理速度,而不会牺牲精度。此外,YOLO11 在设计时考虑了内存效率,与基于 Transformer 的模型或旧的重型架构相比,在训练过程中需要更少的 GPU 内存。

了解更多关于 YOLO11 的信息

性能分析:指标与基准

性能指标的比较揭示了两种模型在效率和可扩展性方面的显著差异。YOLO11 始终在速度和精度之间表现出卓越的平衡,尤其是在考虑所需的计算资源时。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

效率与速度解读

数据突出显示了 YOLO11 在模型效率方面的显著优势。例如,YOLO11x 达到了 PP-YOLOE+x 的 54.7 mAP,但仅使用 56.9M 参数,而 PaddlePaddle 模型则需要庞大的 98.42M 参数。这表示模型大小减少了 40% 以上,直接对应着更低的存储需求和更快的加载时间。

实时推理方面,YOLO11 在 T4GPU 基准测试的所有模型大小上都优于 PP-YOLOE+。这种差异对于自动驾驶或高速工业分拣等对延迟敏感的应用至关重要。此外,YOLO11 的CPU 基准的可用性强调了其对各种硬件环境的优化,包括那些没有专用加速器的硬件环境。

训练方法与易用性

这两种模型之间的用户体验差异显著,这主要归因于它们底层的生态系统。

Ultralytics 生态系统优势

Ultralytics YOLO11 受益于一个成熟且维护良好的生态系统,该系统优先考虑开发者生产力。

  • 易用性: 通过简单的 python API,开发者只需几行代码即可加载、训练和部署模型。入门门槛极低,使高级 AI 对初学者和专家双方都易于使用。
  • 训练效率:YOLO11 支持高效训练,并提供现成的预训练权重。该框架自动处理数据增强和超参数调优等复杂任务。
  • 内存要求: YOLO 模型经过优化,在训练期间消耗更少的 CUDA 内存,允许用户在消费级硬件上训练更大的批次或更高的分辨率。

简单的 python 接口

在自定义数据集上训练 YOLO11 模型就像指向一个 yaml 文件一样简单:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)

PP-YOLOE+ 工作流程

使用 PP-YOLOE+ 通常需要采用 PaddlePaddle 框架。尽管功能强大,但该生态系统不如 PyTorch 普及,对于已在 PyTorch 或 TensorFlow 环境中建立的团队来说,可能会导致更陡峭的学习曲线。自定义训练通常涉及修改复杂的配置文件,而不是使用简化的编程接口,并且社区资源——尽管在增长——但不如全球 YOLO 社区广泛。

多功能性与实际应用

两者之间的主要区别在于它们的多功能性。PP-YOLOE+ 主要专注于目标检测。相比之下,YOLO11 是一个多任务的强大工具。

YOLO11:超越检测

YOLO11 的架构支持广泛的计算机视觉任务

理想用例

  • 制造与质量控制: YOLO11 的高速使其能够跟上快速的装配线,实时检测缺陷。其 segmentation 能力可以进一步识别缺陷的确切形状。
  • 边缘计算:由于其性能平衡和较低的参数量,YOLO11是部署在NVIDIA Jetson或树莓派等边缘设备上的卓越选择。
  • 智慧城市:对于交通监控等应用,YOLO11跟踪目标和估计速度的能力在单个模型中提供了全面的解决方案。

尽管 PP-YOLOE+ 在 PaddlePaddle 领域内仍是一个有能力的 detect 器,但 Ultralytics YOLO11 对于绝大多数开发者和研究人员而言,脱颖而出成为更优选择。

YOLO11 在速度和准确性之间提供了更优的权衡,消耗更少的计算资源,并在多项视觉任务中提供无与伦比的多功能性。结合活跃的社区、详尽的文档以及与Ultralytics HUB等工具的无缝集成,YOLO11 助力用户更高效、更轻松地构建和部署强大的 AI 解决方案。

对于那些希望充分利用现代计算机视觉潜力而又不受框架锁定束缚的人来说,YOLO11 是明确的前进方向。

探索其他比较

为了进一步了解 YOLO11 如何与竞争对手抗衡,请查阅我们其他的详细比较:


评论