Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ 与 YOLOX 对比#

计算机视觉领域的发展在很大程度上受到了目标检测模型快速演进的影响。PP-YOLOE+ 和 YOLOX 是这一进程中的重要里程碑,这两种架构都在实时性能和准确性方面突破了极限。对于构建下一代视觉识别系统的研究人员和开发者而言,理解它们的架构细微差别、性能权衡以及理想的部署场景至关重要。

Link to this section模型谱系与详情#

在深入探讨技术架构之前,先梳理一下这两个模型的起源会很有帮助。每一个模型的开发都是为了解决目标检测中的特定瓶颈,并深受其背后组织的影响。

PP-YOLOE+ 详情:

了解更多关于 PP-YOLOE+ 的信息

YOLOX 详情:

了解更多关于 YOLOX 的信息

Link to this section架构创新#

这两个检测器之间的核心区别在于它们对特征提取和边界框预测的处理方式。

YOLOX 在 2021 年引起了轰动,它成功地将 YOLO 系列适配为无锚框 (anchor-free) 设计。通过移除锚框,YOLOX 显著减少了自定义数据集所需的设计参数和启发式调优工作。此外,它引入了解耦头(decoupled head),将分类和定位任务分离到不同的神经通路中。这种分离解决了物体分类与空间坐标回归之间固有的冲突,从而加快了训练过程中的收敛速度。

PP-YOLOE+ 由百度开发,针对 PaddlePaddle 生态系统进行了深度优化。它以前代产品 PP-YOLOv2 为基础,引入了动态标签分配策略 (TAL) 和一种名为 CSPRepResNet 的新型骨干网络。该骨干网络利用了结构重参数化(structural re-parameterization),使模型在训练时能够受益于复杂的多分支架构,同时在推理时又能无缝转换为快速的单路径网络。

结构重参数化

结构重参数化允许模型在训练时使用多个并行分支(改善梯度流),然后从数学上将这些分支折叠成单个卷积层进行部署,从而在不牺牲准确性的前提下提升推理速度。

Link to this section性能与指标对比#

将这些模型进行直接对比时,显而易见它们在性能领域各有侧重。PP-YOLOE+ 通常能实现更高的绝对准确度,而 YOLOX 则在提供适用于高约束硬件的极轻量化变体方面表现出色。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

注意:每个相关列段中性能最好的值均以粗体标出。

虽然 YOLOX 提供的 nano 和 tiny 变体几乎不占用磁盘空间或 CUDA 内存,但 PP-YOLOE+ 在服务器级硬件上表现出极强的扩展性,使其成为百度生态内重工业应用的稳健选择。

Link to this section实际应用场景#

在这些框架之间进行选择,往往取决于集成需求和硬件目标。

Link to this sectionYOLOX 的优势场景#

由于其无锚框特性以及极简边缘端变体的可用性,YOLOX 在机器人技术和微控制器部署中很受欢迎。其简单的后处理流水线使其更容易移植到 TensorRTNCNN 等定制化 NPU 硬件格式上。

Link to this sectionPP-YOLOE+ 的优势所在#

对于深度集成在利用百度技术栈的亚洲制造中心的组织而言,PP-YOLOE+ 提供了一条预先优化的部署路径。它在运行于强大服务器机架上且对严格实时性要求允许稍重模型权重的质量检测场景中表现优异。

Link to this section应用场景与建议#

在 PP-YOLOE+ 和 YOLOX 之间进行选择,取决于你的具体项目需求、部署约束和生态系统偏好。

Link to this section何时选择 PP-YOLOE+#

PP-YOLOE+ 是以下情况的有力选择:

  • PaddlePaddle 生态系统集成: 现有基础设施基于 百度 PaddlePaddle 框架和工具的组织。
  • Paddle Lite 边缘部署: 部署到专门针对 Paddle Lite 或 Paddle 推理引擎高度优化的推理内核的硬件上。
  • 高精度服务器端检测: 在强大的 GPU 服务器上优先考虑最高检测精度,且框架依赖性不是主要考量的情况。

Link to this section何时选择 YOLOX#

推荐 YOLOX 的场景:

  • 无锚点检测研究: 学术研究使用 YOLOX 简洁的无锚点架构作为基准,用于实验新的检测头或损失函数。
  • 超轻量级边缘设备: 部署在微控制器或遗留移动硬件上,此时 YOLOX-Nano 变体极小的体积(0.91M 参数)至关重要。
  • SimOTA 标签分配研究: 探索基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this sectionUltralytics 的优势:了解 YOLO26#

虽然 PP-YOLOE+ 和 YOLOX 代表了卓越的研究里程碑,但现代部署环境要求更具凝聚力、更对开发者友好且具有更卓越效率的体验。这就是 Ultralytics YOLO26 彻底重新定义现代视觉 AI 标准的地方。

对于希望从孤立的研究仓库转向生产就绪系统的团队,Ultralytics 提供了一个健壮且维护良好的生态系统。训练模型不再需要配置复杂的环境;只需访问统一的 Python API 即可。

Ultralytics YOLO26 的主要优势包括:

  • 端到端无 NMS 设计: 与 PP-YOLOE+ 和 YOLOX 不同(两者都需要非极大值抑制 (NMS) 来过滤冗余边界框),YOLO26 原生支持端到端。这消除了延迟瓶颈并极大简化了部署逻辑。
  • CPU 推理速度提升高达 43%: 通过策略性地移除分布焦点损失 (DFL),YOLO26 在 CPU 硬件上实现了无与伦比的推理速度,使其在边缘计算和低功耗设备上表现远优于其他模型。
  • MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 启发,这种混合优化器将大模型训练的稳定性带到了计算机视觉领域,确保了更快的收敛速度,并最大限度地减少了训练阶段的内存需求。
  • ProgLoss + STAL: 这些先进的损失函数显著提升了小物体识别能力,这是无人机作业和高细节航空影像的关键功能。
  • 通用性: 虽然 PP-YOLOE+ 和 YOLOX 仅专注于检测,但 YOLO26 使用完全相同的直观语法无缝处理实例分割姿态估计旋转边界框 (OBB)

了解更多关于 YOLO26 的信息

Link to this section使用 Ultralytics 进行精简训练#

Ultralytics 模型的内存效率和训练速度是无与伦比的,完全超越了需要巨大 CUDA 内存开销的 Transformer 类替代方案。你只需几行代码即可利用 YOLO26 的强大功能:

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
探索 Ultralytics 平台

对于寻求无代码解决方案的团队,Ultralytics 平台为你的所有 YOLO 模型提供基于云的训练、集成的数据集标注和一键部署。

Link to this section结论#

PP-YOLOE+ 和 YOLOX 都已在计算机视觉历史上占有一席之地,分别提供了高精度和轻量级无锚框设计。然而,对于构建农业 AI、智慧城市和零售业未来的组织而言,Ultralytics YOLO26 的持续维护、易用性和原生无 NMS 架构使其成为不二之选。

如果你正在为特定基准测试探索替代架构,你也可以通过详尽的 Ultralytics 文档比较较旧的 YOLO11 或基于 Transformer 的选项,如 RT-DETR。通过迁移到统一的 Ultralytics 生态系统,开发者可以节省宝贵的时间和资源,同时在任何边缘或云部署上实现最先进的成果。

评论