Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 PP-YOLOE+ 的对比#

实时目标检测领域持续快速发展,为计算机视觉工程师提供了广泛的选择,以便在边缘和云基础设施上部署高精度模型。该领域的两个主流模型是 YOLOv9PP-YOLOE+。虽然两者都突破了精度和速度的极限,但它们源自不同的研究谱系和软件生态系统。

这份全面的技术对比将探讨它们的架构、训练方法、性能指标以及理想的实际应用场景。我们还将探讨更广泛的 Ultralytics 生态系统 如何为优先考虑易用性、内存效率和多功能部署的开发者提供显著优势。

Link to this section模型起源与技术规格#

了解这些模型的背景有助于从上下文理解它们的架构决策和框架依赖。

Link to this sectionYOLOv9:解决信息瓶颈#

YOLOv9 于 2024 年初推出,旨在解决信息在深度神经网络中流动时发生的数据丢失问题。它是一个高度优化的 卷积神经网络,旨在最大限度地提高参数效率。

了解更多关于 YOLOv9 的信息

Link to this sectionPP-YOLOE+:推进 Paddle 生态系统#

PP-YOLOE+ 由百度于 2022 年发布,是 PP-YOLOv2 的迭代改进版本。它采用无锚框(anchor-free)范式,并引入了动态标签分配策略,以提高 PaddlePaddle 框架 内的收敛性和准确性。

了解关于 PP-YOLOE+ 的更多信息

Link to this section架构对比#

Link to this section可编程梯度信息 (PGI) 与 CSPRepResStage#

YOLOv9 的核心创新是 可编程梯度信息 (PGI)。PGI 作为一种辅助监督框架,确保了重要的梯度信息在训练过程中得以保留并准确传播回浅层。这与 通用高效层聚合网络 (GELAN) 相结合,该网络结合了 CSPNet 和 ELAN 的优势,在大幅降低计算成本 (FLOPs) 的同时提供高精度。

PP-YOLOE+ 依赖于一种名为 CSPRepResStage 的专用骨干网络。它利用重参数化技术(类似于在 RepVGG 中所见),通过在部署期间合并卷积层来加速推理。此外,它使用高效的任务对齐头 (ET-head) 来平衡分类和回归任务。

虽然 PP-YOLOE+ 非常稳健,但 YOLOv9 的 GELAN 架构在训练和推理过程中通常需要 更小的内存占用,这使其非常适合 边缘 AI 设备

Link to this section性能比较#

在评估生产环境模型时,mAP(平均精度均值)、推理速度和模型大小之间的权衡至关重要。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this section分析#

  • 参数效率: YOLOv9 实现了显著更高的效率。例如,YOLOv9c 在仅使用 25.3M 参数的情况下达到了 53.0% 的 mAP,而 PP-YOLOE+l 需要两倍以上的参数 (52.2M) 才能达到略低的 52.9% mAP。这显著降低了 YOLOv9 的内存需求。
  • 推理速度: YOLOv9 模型展示了对 TensorRT 等硬件加速器的出色优化,在 NVIDIA T4 GPU 上产生具有竞争力的推理速度,这对 实时推理 至关重要。

Link to this section训练方法与生态系统#

在这些模型之间进行选择通常取决于软件生态系统。

Link to this sectionPP-YOLOE+ 与 PaddlePaddle#

PP-YOLOE+ 与 PaddleDetection 套件紧密耦合。虽然功能强大,但它要求用户处理一个配置繁琐、由命令行驱动的环境。对于深度嵌入 PyTorchTensorFlow 生态系统的团队来说,迁移到 PaddlePaddle 会带来显著的摩擦和更陡峭的学习曲线。

Link to this sectionUltralytics 的优势:精简的工作流程#

相比之下,YOLOv9 在高度完善的 Ultralytics 生态系统 中运行。Ultralytics 专为开发者和研究人员设计,优先考虑卓越的易用性。Python API 完全抽象了复杂的样板代码。

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
model.export(format="onnx")

此工作流程突显了 Ultralytics 模型卓越的 训练效率。对数据增强、分布式训练以及到 Weights & BiasesMLflow 等平台的自动记录功能的原生支持是标准配置。

探索视觉 AI 的最新动态

尽管 YOLOv9 性能卓越,但我们强烈建议在新项目中考虑新发布的 Ultralytics YOLO26。YOLO26 采用了原生的 端到端无 NMS 设计,极大地简化了部署。借助 DFL 移除(移除分布焦点损失以简化导出并提高与边缘/低功耗设备的兼容性),它为边缘计算提供了高达 43% 的 CPU 推理速度提升。由 MuSGD 优化器 驱动,它确保了稳定的训练和快速的收敛。此外,ProgLoss + STAL 提供了改进的损失函数,在小目标识别方面有显著提升,这对于物联网、机器人和航空影像至关重要。

Link to this section多功能性与任务支持#

现代计算机视觉项目很少仅止于简单的边界框。

PP-YOLOE+ 主要针对标准目标检测而设计。调整其架构以适应其他任务需要大量的定制工程。

相反,Ultralytics 框架是一个多任务的强大引擎。通过利用统一的 API,开发者可以轻松地从标准目标检测切换到复杂的 实例分割、高精度的 姿态估计、针对航空影像的 旋转边界框 (OBB) 检测,以及图像 分类。这种无与伦比的多功能性是企业团队持续选择 Ultralytics 模型(如 YOLOv9、YOLO11 和 YOLO26)的原因。

Link to this section理想的使用案例和应用#

  • 智慧城市分析与交通管理: YOLOv9(以及后续的 YOLO26)的高参数效率和低延迟使其非常适合部署在受限的边缘硬件(如 NVIDIA Jetson 设备)上,以监测 交通流量 和城市安全。
  • 零售库存系统: 对于检测货架上密集排列的小型商品,YOLOv9 的 PGI 能有效保留细粒度的空间细节,在小目标检测任务上优于 PP-YOLOE+。
  • 遗留部署: PP-YOLOE+ 仅对于被明确要求在现有遗留基础设施中使用百度/PaddlePaddle 技术栈的团队来说,仍然是一个可行的选择。

对于探索基于 Transformer 架构的研究人员,Ultralytics 还在完全相同的易用 API 中原生支持 RT-DETR,确保你始终能够为特定的部署要求获得最优模型。

评论