Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLO26:从无锚点(Anchor-Free)到端到端(End-to-End)目标检测的演进#

计算机视觉领域在过去十年中经历了惊人的变革。这一历程中的两个重要里程碑分别是 YOLOX 的发布(它普及了无锚点架构)以及最近推出的 Ultralytics YOLO26,它通过原生的端到端、无需 NMS 的设计彻底重新定义了实时性能。这份详尽的对比分析探讨了它们的架构、性能指标和理想的部署场景,旨在帮助开发者为下一个 AI 项目做出明智的决策。

Link to this section模型概述#

了解每个模型的起源和主要设计目标,能为理解它们各自的技术成就提供必要的背景。

Link to this sectionYOLOX#

作者:Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, 和 Jian Sun
机构:Megvii
日期:2021-07-18
Arxiv:2107.08430
GitHub:Megvii-BaseDetection/YOLOX
文档:YOLOX ReadTheDocs

YOLOX 于 2021 年年中推出,通过采用无锚点设计、解耦头(decoupled head)以及名为 SimOTA 的先进标签分配策略,代表了一次重大转变。YOLOX 摆脱了主导先前架构的传统锚框(anchor box)机制,成功架起了学术研究与工业应用之间的桥梁,为 目标检测 提供了一个既优雅又高效的框架。

了解更多关于 YOLOX 的信息

Link to this sectionYOLO26#

作者:Glenn Jocher 和 Jing Qiu
机构:Ultralytics
日期:2026-01-14
GitHub:ultralytics/ultralytics
平台:Ultralytics Platform

发布于 2026 年初的 YOLO26 是多年迭代改进的结晶,重点关注边缘部署和简化的训练流程。它引入了 端到端无需 NMS 的设计,彻底消除了传统的非极大值抑制(NMS)后处理步骤。这一突破显著简化了跨不同硬件的模型部署。此外,通过移除分布焦点损失(DFL)模块,YOLO26 实现了更低的延迟,巩固了其作为现代 计算机视觉应用 首选方案的地位。

了解更多关于 YOLO26 的信息

Link to this section架构创新#

这两个模型的架构凸显了深度学习方法的快速进步,特别是在损失函数和后处理方面。

Link to this sectionYOLOX 的方法#

YOLOX decoupled the classification and regression tasks in its prediction head, which significantly accelerated convergence during training. Its anchor-free nature reduced the number of design parameters, mitigating the need for complex anchor tuning prior to training. Coupled with the SimOTA label assignment algorithm, YOLOX achieved state-of-the-art results for its time, particularly on standard benchmarks like the COCO dataset.

Link to this sectionYOLO26 的优势#

YOLO26 将架构效率提升到了一个新的高度。移除 NMS 不仅减少了推理延迟,还确保了执行时间的一致性和确定性,这对 自动驾驶 和机器人技术来说是一个关键因素。

YOLO26 的主要创新包括:

  • MuSGD 优化器: 受大语言模型(LLM)训练技术的启发,这种 SGD 和 Muon 的混合体确保了极其稳定的训练运行和更快的收敛速度。
  • CPU 推理速度提升高达 43%: 通过消除 DFL 并精简网络架构,YOLO26 针对资源受限的边缘设备进行了深度优化,从简单的物联网传感器到 Raspberry Pi 开发板均适用。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面带来了显著提升,这对于分析 航空影像 和进行 制造业自动化 中的精确质量控制至关重要。
边缘优先优化

如果你的项目面向嵌入式系统或没有专用 GPU 的移动应用,YOLO26 的 CPU 性能优化提供了巨大的优势,其计算开销远低于前几代模型。

Link to this section性能与基准测试#

在评估生产环境模型时,分析精度、速度和计算复杂度之间的平衡至关重要。以下是针对图像尺寸为 640 像素(nano/tiny 版本为 416 像素)的标准模型进行的详细对比。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

如表所示,YOLO26 系列提供了更优的性能平衡。例如,YOLO26x 在参数量仅为 YOLOXx 模型约一半的情况下,达到了 57.5 mAP,这直接转化为更快的 GPU 推理速度(11.8 毫秒对比 16.1 毫秒)以及更卓越的部署灵活性。

Link to this section训练和生态系统体验#

这些架构之间最深刻的区别之一在于其易用性和生态系统支持。

虽然 YOLOX 仍然是研究梯度流和无锚点机制的研究人员的基础存储库,但其配置可能较为复杂,通常需要手动配置依赖项和算子。相比之下,Ultralytics 生态系统 定义了行业领先的易用性标准。

通过使用统一的 Python API,开发者可以极其简单地初始化、训练和部署 YOLO26 模型。该系统原生支持数据集下载、超参数调优,以及无缝导出为 ONNXTensorRT 和 OpenVINO 等格式。

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

此外,与繁重的基于 Transformer 的替代方案相比,Ultralytics YOLO 模型在训练期间的内存需求明显更低,使工程师即使在消费级硬件上也能训练更大的批次。

Link to this section实际应用场景#

在 YOLOX 和 YOLO26 之间进行选择,最终取决于你的部署限制和多任务需求。

Link to this sectionYOLOX 的优势场景#

YOLOX 仍然是特定学术基准和深度集成 MegEngine 框架的遗留系统的可行选择。它的历史地位使其成为研究 无锚点检测器 和自定义分配策略的热门基准。

Link to this sectionYOLO26 的优势场景#

YOLO26 从根本上是为现代工业应用而设计的。因为它原生支持 实例分割姿态估计旋转边界框 (OBB),所以它比标准的检测引擎要通用得多。

  • 智能零售和库存: 利用无需 NMS 的设计,确保自动化结账系统以超低延迟处理视频流,在没有后处理循环瓶颈的情况下识别产品。
  • 无人机和航空分析: 针对 OBB 的专用角度损失以及 ProgLoss + STAL 的集成,使 YOLO26 在检测大范围卫星图像中的旋转物体和细小特征方面表现无可匹敌。
  • 边缘安全系统: 凭借其快 43% 的 CPU 推理速度,YOLO26 允许公司直接在低成本的本地硬件上部署强大的安全分析功能,而无需昂贵的云端算力。

Link to this section应用场景与建议#

选择 YOLOX 还是 YOLO26 取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOX#

YOLOX 是以下场景的有力选择:

  • 无锚点检测研究: 学术研究使用 YOLOX 简洁的无锚点架构作为基准,用于实验新的检测头或损失函数。
  • 超轻量级边缘设备: 部署在微控制器或遗留移动硬件上,此时 YOLOX-Nano 变体极小的体积(0.91M 参数)至关重要。
  • SimOTA 标签分配研究: 探索基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 YOLO26#

建议在以下情况下选择 YOLO26:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section探索其他 Ultralytics 模型#

如果你正在探索计算机视觉的演进,Ultralytics 系列中还有其他值得研究的高性能模型:

  • YOLO11 YOLO26 的前身,为稳定的生产环境提供了强大的性能和广泛的社区支持。
  • YOLOv8 一个经过大量实战考验的架构,为成千上万个实际部署场景设定了易用性和灵活性的标准。

总之,虽然 YOLOX 为目标检测领域引入了关键概念,但全新的 YOLO26 在速度、精度和部署简洁性上实现了代际跨越,使其成为前瞻性开发者和企业的最终选择。

评论