Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOX:无锚框目标检测的新时代#

计算机视觉的发展历程中伴随着多次重大的架构飞跃。2021 年,YOLOX 引入了一种极具影响力的无锚框(anchor-free)范式,架起了学术研究与工业应用之间的桥梁。快进到 2026 年,Ultralytics YOLO 的出现重新定义了这一领域,特别是 YOLO26 的发布。这份综合对比旨在探讨 YOLO26 如何在历史创新的基础上,提供无与伦比的性能、多功能性与易用性。

Link to this section模型概览#

了解这些模型的起源和核心理念,对于做出明智的部署决策至关重要。

Link to this sectionYOLO26 详情#

了解关于 YOLO26 的更多信息

YOLO26 代表了现代 AI 工程的巅峰,它提供了原生的端到端设计,消除了复杂的后处理瓶颈。它针对云端和边缘设备部署进行了深度优化,其生态系统能够无缝支持多种任务。

Link to this sectionYOLOX 详情#

了解更多关于 YOLOX 的信息

YOLOX 是一个重大的进步,它引入了解耦头(decoupled head)和无锚框架构,以及 SimOTA 标签分配策略。在发布当时,它在速度和准确性之间提供了极佳的平衡,使其成为许多传统系统的热门选择。

Link to this section架构创新#

YOLO26 与 YOLOX 之间的差异凸显了深度学习设计在过去五年中的持续创新。

尽管 YOLOX 推崇无锚框方法,但它仍然严重依赖传统的非极大值抑制(NMS)来过滤冗余的边界框。YOLO26 引入了端到端无 NMS 设计。这一突破最早由 YOLOv10 率先采用,它彻底消除了 NMS 后处理,从而带来更快、更简单的部署流程,且延迟波动显著降低。

此外,YOLO26 实现了 DFL 移除。通过移除分布焦点损失(Distribution Focal Loss),模型的导出过程被大幅简化,确保了与边缘设备及低功耗硬件的卓越兼容性。结合模型架构层面的优化,YOLO26 相比前代产品实现了高达 43% 的 CPU 推理速度提升,使其成为在缺乏专用 GPU 环境下的强大工具。

训练稳定性是另一个关键的差异点。YOLO26 使用了创新的 MuSGD 优化器,这是受 Moonshot AI 大语言模型训练创新启发,结合 SGD 与 Muon 的混合优化器。该优化器将大语言模型的训练稳定性引入计算机视觉领域,显著促进了收敛速度。

高级损失函数

YOLO26 使用 ProgLoss + STAL,这些专用损失函数在小目标识别方面带来了显著提升。这对于处理 航拍图像 和分析密集环境等复杂任务至关重要。

Link to this section性能与基准测试#

COCO 数据集 上对比这两个模型时,YOLO26 在准确性和效率方面的优势显而易见。Ultralytics 模型在训练期间始终保持较低的内存需求,且推理速度更快。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

注:YOLO26x 模型达到了惊人的 57.5 mAP,同时所需参数量(55.7M)远低于 YOLOXx 模型(99.1M),这突显了 Ultralytics 架构卓越的参数效率。

Link to this section生态系统与易用性#

选择 YOLO26 最显著的优势之一是 Ultralytics 提供的完善生态系统。YOLOX 需要用户研究复杂的代码库并手动配置环境,而 Ultralytics 提供了一种精简的、“从零到一”的开发者体验。

通过统一的 Python API,开发者可以轻松切换任务,如 目标检测实例分割图像分类姿态估计。而 YOLOX 仅限于边界框检测。

Link to this section训练示例#

使用 Ultralytics 在自定义数据集上训练模型非常高效。训练流水线最大限度地减少了 CUDA 内存占用,即使在消费级硬件上也能实现更大的批处理大小,这与旧架构或笨重的 Transformer 模型形成了鲜明对比。

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Ultralytics Platform 进一步增强了这一工作流,提供云端训练、自动化数据标注以及一键部署选项。对于那些希望快速从原型过渡到生产环境的团队来说,它是必不可少的工具。

Link to this section理想的使用场景与实际应用#

选择合适的模型决定了你实际部署的成功与否。

Link to this section边缘 AI 与物联网#

对于需要在有限硬件上进行本地处理的应用,例如智能 安全警报系统 或远程环境传感器,YOLO26 是最终选择。其无 NMS 架构和快 43% 的 CPU 执行速度意味着它能在 Raspberry Pi 等设备上流畅运行,无需复杂的量化变通方法。

Link to this section自主机器人#

机器人技术需要高精度和低延迟。YOLO26 的 姿态估计 能力,加上残差对数似然估计(RLE)的加持,使机器人能够实时理解人类运动学。YOLOX 缺乏原生关键点检测,不适用于此类先进的人机交互任务。

Link to this section高空与航空巡检#

在使用无人机巡检基础设施时,检测微小缺陷至关重要。YOLO26 中的 ProgLoss 和 STAL 函数显著提高了对微小目标的召回率。此外,YOLO26 原生支持 旋转边界框 (OBB),配备专门的角度损失函数以解决边界问题,使其非常适合目标呈现任意旋转的卫星和航拍图像。

Link to this section旧有部署#

YOLOX 在一些旧有环境中可能仍有用武之地,即那些在 2021 年专门围绕其解耦头输出构建了 C++ 部署流水线的环境。然而,对于任何新项目,强烈建议迁移到 Ultralytics 生态系统,以便利用现代性能提升和持续的社区支持。

Link to this section探索其他模型#

虽然 YOLO26 代表了当前的最先进水平,但 Ultralytics 生态系统提供了各种针对特定需求定制的模型。对于对基于 Transformer 的架构感兴趣的开发者,RT-DETR 提供了一种实现端到端检测的替代方法。此外,YOLO11 仍然是生产环境中一个稳健且经过充分测试的选择,特别适合需要详尽历史基准测试的场景。

总结来说,从 YOLOX 到 YOLO26 的转变展示了该领域的飞速进步。通过结合直观的 API、多功能的特性集以及无与伦比的效率,YOLO26 成为全球研究人员和开发者的首选。

评论