Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 与 RTDETRv2#

计算机视觉领域近年来经历了巨大的演变,尤其是在实时目标检测方面。为你的部署选择合适的架构,决定了应用是运行迟缓、占用大量内存,还是高度优化、响应迅速。在这篇技术对比文章中,我们将探索百度旗下的两款出色模型:基于 CNN 的 PP-YOLOE+ 和基于 Transformer 的 RTDETRv2。我们将分析它们的架构、性能指标和理想用例,同时探讨它们与业界领先的 Ultralytics YOLO26 平台的对比情况。

Link to this sectionPP-YOLOE+:推进 CNN 范式#

作为前代产品的迭代,PP-YOLOE+ 突破了传统卷积神经网络 (CNN) 在目标检测领域的能力极限。它是一款功能强大的无锚点 (anchor-free) 检测器,在 YOLO 系列基础机制之上构建,并针对 PaddlePaddle 生态系统进行了专项优化。

模型详情:

Link to this section架构与方法#

PP-YOLOE+ 依赖于经过深度优化的主干网络 (backbone) 和定制的特征金字塔网络来高效聚合多尺度特征。它采用了无锚点设计,简化了通常生成锚框 (anchor box) 所需的启发式调整过程。此外,其训练方法还包括先进的标签分配策略,以便在学习阶段更好地匹配预测结果与真实边框 (ground truth boxes)。

Link to this section优势与用例#

PP-YOLOE+ 的主要优势在于其在标准服务器硬件上的稳健表现,以及与百度工具的深度集成。它非常适合传统的工业工作流,例如在硬件限制不那么严格的制造环境中进行静态 缺陷检测

了解更多关于 PP-YOLOE+ 的信息

生态系统考量

虽然 PP-YOLOE+ 提供了强大的准确性,但在其原生生态系统之外进行部署有时需要额外的转换步骤,这与现代 Ultralytics 流水线中现成的原生导出格式有所不同。

Link to this sectionRTDETRv2:实时检测 Transformer#

RTDETRv2(实时检测 Transformer 第 2 版)摆脱了纯 CNN 的限制,代表了计算机视觉任务向注意力机制的跨越。它试图将 Transformer 的全局上下文理解能力与现实应用所需的低延迟相结合。

模型详情:

Link to this section架构与方法#

RTDETRv2 利用混合架构,将用于特征提取的 CNN 主干网络与精简的 Transformer 编码器-解码器相结合。RTDETRv2 的一个决定性特征是其原生端到端设计,跳过了传统的非极大值抑制 (NMS) 后处理。它还引入了多尺度检测和复杂场景处理等功能,利用自注意力机制来理解远距离对象之间的空间关系。

Link to this section优势与用例#

Transformer 架构使得 RTDETRv2 在对全局上下文理解至关重要的场景中非常有效。然而,与轻量级 CNN 相比,Transformer 模型在训练和推理过程中通常需要更高的 CUDA 内存。它最适合硬件资源不受限的环境,例如在强大的 GPU 服务器上运行的云端 视频分析

了解更多关于 RTDETR 的信息

Link to this section性能与指标对比#

在评估这些模型时,平均精度均值 (mAP) 与计算成本(以 FLOPs 和推理延迟衡量)之间的权衡至关重要。下表概述了不同规模的 PP-YOLOE+ 和 RTDETRv2 的关键指标。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

虽然 RTDETRv2 以更高的参数量和 FLOPs 为代价展现了强大的 mAP,但希望在受限边缘设备上进行部署的开发者,往往会因为 Transformer 层典型的巨大内存需求而面临瓶颈。

Link to this section应用场景与建议#

在 PP-YOLOE+ 和 RT-DETR 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 PP-YOLOE+#

PP-YOLOE+ 是以下情况的有力选择:

  • PaddlePaddle 生态系统集成: 现有基础设施基于 百度 PaddlePaddle 框架和工具的组织。
  • Paddle Lite 边缘部署: 部署到专门针对 Paddle Lite 或 Paddle 推理引擎高度优化的推理内核的硬件上。
  • 高精度服务器端检测: 在强大的 GPU 服务器上优先考虑最高检测精度,且框架依赖性不是主要考量的情况。

Link to this section何时选择 RT-DETR#

推荐使用 RT-DETR 的场景为:

  • 基于 Transformer 的检测研究: 探索注意力机制和 Transformer 架构以实现无 NMS 的端到端目标检测的项目。
  • 高精度、延迟要求宽松的场景: 将检测精度置于首位,且可以容忍稍高推理延迟的应用。
  • 大目标检测: 以中大型目标为主的场景,在这种场景下,Transformer 的全局注意力机制具有天然优势。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this sectionUltralytics 的优势:隆重介绍 YOLO26#

尽管 PP-YOLOE+ 和 RTDETRv2 都代表了重要的里程碑,但现代开发者需要一个能在极致性能与精简易用性之间实现完美平衡的生态系统。Ultralytics Platform 和突破性的 YOLO26 模型恰好提供了这一点。

YOLO26 发布于 2026 年 1 月,确立了以边缘设备为先的视觉 AI 新标准。它优雅地解决了旧架构带来的部署障碍,同时在速度和准确性上都超越了它们。

Link to this section架构创新#

YOLO26 引入了多项领先的增强功能,胜过传统的 CNN 和大型 Transformer:

  • 端到端无 NMS 设计: 与 RTDETRv2 一样,YOLO26 是原生的端到端模型。通过取消非极大值抑制 (NMS) 后处理,它提供了更快、更简单的部署流程,且延迟抖动更小,非常适合实时 机器人 和自主系统。
  • CPU 推理速度提升高达 43%: 通过深度的架构优化,YOLO26 在缺乏独立 GPU 的边缘设备上显著优于竞争模型,使其成为物联网 (IoT) 和 智慧城市 应用的首选。
  • MuSGD 优化器: 受 LLM 训练创新的启发,YOLO26 采用了 SGD 和 Muon 的混合优化器。这带来了更稳定的训练轨迹和惊人的收敛速度,大幅减少了 GPU 的训练时间。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面取得了显著改进,而这是 PP-YOLOE+ 等模型历史上难以解决的领域,对于 航空影像 和无人机应用至关重要。
  • 移除 DFL: 移除分布焦点损失 (Distribution Focal Loss) 简化了导出流程,确保了在各种边缘设备和低功耗设备上的无缝兼容性。

了解更多关于 YOLO26 的信息

任务特定多功能性

与专业的目标检测器不同,YOLO26 具有高度通用性,支持 实例分割姿态估计分类旋转边界框 (OBB)。它包含针对特定任务的增强功能,如用于姿态估计的 RLE 和用于 OBB 的专门角度损失。

Link to this section无可比拟的易用性#

采用 RTDETRv2 等复杂架构的一大弊端是其高昂的学习曲线和零散的集成过程。Ultralytics 生态系统通过直观的 Python API 和功能全面的 Web 平台,完全抽象了这些复杂性。

无论你是 训练自定义数据集 还是进行快速推理,流程都是无缝的:

from ultralytics import RTDETR, YOLO

# Initialize the state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Alternatively, initialize an RT-DETR model via the same simple API
model_rtdetr = RTDETR("rtdetr-l.pt")

# Run real-time inference effortlessly
results = model_yolo("https://ultralytics.com/images/zidane.jpg")
results[0].show()

# Export for edge deployment in one line
model_yolo.export(format="engine", quantize=16)

Ultralytics YOLO 模型典型的低内存需求意味着与基于 Transformer 的同类模型相比,你可以更快地进行训练并在更廉价的硬件上进行部署。此外,积极的开发进度和世界一流的文档确保了你的生产流水线保持稳定。

对于正在探索替代方案的团队,YOLO11 仍然是生态系统中得到高度支持且能力卓越的前代产品,为遗留硬件集成提供了绝佳的基础。你可能还会发现阅读我们关于 YOLO11 vs RTDETR 的对比文章很有帮助。

Link to this section总结#

PP-YOLOE+ 和 RTDETRv2 为计算机视觉的演进做出了巨大贡献,分别证明了先进 CNN 流水线和实时 Transformer 的可行性。然而,对于希望在 2026 年部署稳健、多功能且高度优化的计算机视觉应用的组织而言,Ultralytics YOLO26 提供了无与伦比的解决方案。其原生的无 NMS 架构、显著更快的 CPU 推理速度以及精简的生态系统,使开发者能够比以往更快地从构思转向可扩展的生产。

评论