Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 与 YOLOv5#

在为计算机视觉选择合适的深度学习框架时,开发者经常需要对比不同架构的功能,以找到速度、精度和部署便捷性之间的完美平衡。在这篇深度解析中,我们将探讨 PP-YOLOE+ 与 YOLOv5 之间的技术差异。通过分析它们的架构、性能指标和理想的部署场景,你可以为你的下一个项目做出明智的决定,无论该项目涉及实时机器人技术、边缘部署还是基于云端的视频分析。

Link to this section模型起源与元数据#

这两个模型都源自实力雄厚的工程团队,但针对的生态系统略有不同。了解它们的起源能为你理解其架构设计决策提供宝贵的背景信息。

PP-YOLOE+ 详情:

了解更多关于 PP-YOLOE+ 的信息

YOLOv5 详细信息:

了解更多关于 YOLOv5 的信息

Link to this section架构对比#

Link to this sectionPP-YOLOE+ 架构#

PP-YOLOE+ 是 Baidu 生态系统内的一次演进,建立在 PP-YOLOv2 等前代模型的基础上。它引入了经过深度优化的 CSPRepResNet 主干网络,通过结合跨阶段局部 (CSP) 网络原理与重参数化技术,增强了特征提取能力。这使得模型在训练时能够保持高精度,同时在推理时能够收敛为更精简的架构,从而提升速度。

此外,PP-YOLOE+ 采用了任务对齐学习 (TAL) 和高效任务对齐头 (ET-head)。这种组合旨在解决分类任务与定位任务之间的错位问题,这是密集目标检测器中常见的一个瓶颈。尽管其架构令人印象深刻,但它与 PaddlePaddle 框架 深度耦合,这可能会给那些标准化使用其他主流机器学习库的团队带来集成挑战。

Link to this sectionYOLOv5 架构#

相比之下,YOLOv5 是在 PyTorch 中原生构建的,后者是学术研究和企业生产的行业标准。它利用了改良的 CSPDarknet53 主干网络,以其出色的梯度流和参数效率而闻名。

YOLOv5 的一个标志性功能是其 AutoAnchor 算法,它能在训练前根据你的自定义数据集动态检查并调整锚框 (anchor box) 大小。这消除了手动调整边界框超参数的需要。模型的路径聚合网络 (PANet) 颈部结构确保了强大的多尺度特征融合,使其在检测不同尺寸的目标时非常有效。

精简的 PyTorch 部署

由于 YOLOv5 直接构建在 PyTorch 上,导出到 ONNX 和 TensorRT 等优化格式时,所需的中间件配置比那些绑定在本地化框架上的模型要少得多。

Link to this section性能分析#

评估这些模型需要权衡平均精度均值 (mAP) 与延迟。下表展示了不同模型尺寸下的指标。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

虽然 PP-YOLOE+ 在大尺度(如 X 变体)上实现了极具竞争力的 mAP 分数,但在轻量级领域,YOLOv5 提供了更优的速度和更低的参数量。YOLOv5 Nano (YOLOv5n) 仅需 260 万个参数,使其非常适合内存要求严格的受限边缘设备。此外,与 RT-DETR 等繁重的 Transformer 类模型相比,训练 YOLO 模型通常消耗的 CUDA 内存更少。

Link to this sectionUltralytics 的优势#

在选择架构时,原始指标只是衡量标准的一部分。开发者体验、生态支持和部署流水线往往决定了项目的实际成败。这正是 Ultralytics 模型大放异彩的地方。

Link to this section无可比拟的易用性#

Ultralytics 的 Python API 抽象了复杂的样板代码。开发者可以无缝地启动训练、验证性能并部署模型。其文档详尽、维护良好,并由庞大的全球开源社区提供支持。

Link to this section任务的多功能性#

PP-YOLOE+ 是一个专门的目标检测器,而 Ultralytics 生态系统允许用户在同一个统一 API 下处理多种计算机视觉任务。使用 YOLOv5 及其后续版本,你可以轻松地从标准边界框过渡到 图像分割 和分类工作流。

Link to this section代码示例:训练 YOLOv5#

只需几行代码即可上手。这种简洁性显著加快了研发周期。

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this section实际应用场景#

何时选择 PP-YOLOE+: 如果你的组织深度嵌入 Baidu 软件技术栈,或者严重依赖必须使用 PaddlePaddle 框架的专用硬件,那么 PP-YOLOE+ 是一个稳健的选择。它经常被用于亚洲各地的专业制造流水线,这些地方存在与 Paddle 的传统集成。

何时选择 YOLOv5: 对于绝大多数国际开发者、研究人员和企业而言,YOLOv5 依然是一个强有力的工具。它的 PyTorch 血统意味着它能即时兼容 Weights & Biases 等追踪工具,并且可以简洁地导出为 TensorRT 以用于 NVIDIA GPU 加速,或导出为 CoreML 以用于 Apple 设备。它在从农作物监测到高速无人机导航等多个领域表现出色。

Link to this section检测的未来:Ultralytics YOLO26#

虽然 YOLOv5 是一款标志性模型,但计算机视觉的前沿技术已经取得了进步。对于所有新开发项目,我们强烈建议迁移到 2026 年 1 月发布的 YOLO26。通过 Ultralytics 平台 可轻松获取,YOLO26 彻底重新定义了效率。

了解更多关于 YOLO26 的信息

YOLO26 的关键创新:

  • 端到端无需 NMS 的设计: YOLO26 完全消除了非极大值抑制 (NMS) 后处理。这降低了延迟的变异性,并极大简化了部署流水线。
  • CPU 推理速度最高提升 43%: 通过策略性地移除分布焦点损失 (DFL),YOLO26 在无 GPU 的边缘设备上显著提升了运行速度。
  • MuSGD 优化器: 受领先的大型语言模型启发,这种混合优化器稳定了训练动态,并允许在自定义数据集上实现更快的收敛。
  • 特定任务增强: 具备 ProgLoss 和 STAL 等高级损失函数,在微小物体上产生了前所未有的精度。它原生支持用于航拍图像的 旋转边界框 (OBB) 检测。

如果你正在探索最先进的视觉模型,你可能也会对对比上一代 YOLO11 或类似 RT-DETR 的基于 Transformer 的方法感兴趣。最终,强大的生态系统结合尖端的架构进步,巩固了 Ultralytics 作为现代计算机视觉任务首选的地位。

评论