Link to this sectionYOLOX 与 YOLO26 对比#

计算机视觉领域在过去十年中经历了惊人的变革。这一历程中的两个重要里程碑分别是 YOLOX 的发布（它普及了无锚点架构）以及最近推出的 Ultralytics YOLO26，它通过原生的端到端、无需 NMS 的设计彻底重新定义了实时性能。这份详尽的对比分析探讨了它们的架构、性能指标和理想的部署场景，旨在帮助开发者为下一个 AI 项目做出明智的决策。

Link to this section模型概述#

了解每个模型的起源和主要设计目标，能为理解它们各自的技术成就提供必要的背景。

Link to this sectionYOLOX#

作者：Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun\n组织：Megvii\n日期：2021-07-18\nArxiv：2107.08430\nGitHub：Megvii-BaseDetection/YOLOX\n文档：YOLOX GitHub Docs

YOLOX 于 2021 年年中推出，通过采用无锚点设计、解耦头（decoupled head）以及名为 SimOTA 的先进标签分配策略，代表了一次重大转变。YOLOX 摆脱了主导先前架构的传统锚框（anchor box）机制，成功架起了学术研究与工业应用之间的桥梁，为目标检测提供了一个既优雅又高效的框架。

了解更多关于 YOLOX 的信息

Link to this sectionYOLO26#

作者：Glenn Jocher 和 Jing Qiu
机构：Ultralytics
日期：2026-01-14
GitHub：ultralytics/ultralytics
平台：Ultralytics Platform

发布于 2026 年初的 YOLO26 是多年迭代改进的结晶，重点关注边缘部署和简化的训练流程。它引入了 端到端无需 NMS 的设计，彻底消除了传统的非极大值抑制（NMS）后处理步骤。这一突破显著简化了跨不同硬件的模型部署。此外，通过移除分布焦点损失（DFL）模块，YOLO26 实现了更低的延迟，巩固了其作为现代计算机视觉应用首选方案的地位。

了解更多关于 YOLO26 的信息

Link to this section架构创新#

这两个模型的架构凸显了深度学习方法的快速进步，特别是在损失函数和后处理方面。

Link to this sectionYOLOX 的方法#

YOLOX 在其预测头中解耦了分类和回归任务，这显著加快了训练过程中的收敛速度。其无锚点（anchor-free）的特性减少了设计参数的数量，降低了训练前进行复杂锚点调整的需求。结合 SimOTA 标签分配算法，YOLOX 在当时取得了最先进的结果，尤其是在 COCO dataset 等标准基准测试中。

Link to this sectionYOLO26 的优势#

YOLO26 将架构效率提升到了一个新的高度。移除 NMS 不仅减少了推理延迟，还确保了执行时间的一致性和确定性，这对自动驾驶和机器人技术来说是一个关键因素。

YOLO26 的主要创新包括：

MuSGD 优化器： 受大语言模型（LLM）训练技术的启发，这种 SGD 和 Muon 的混合体确保了极其稳定的训练运行和更快的收敛速度。
CPU 推理速度提升高达 43%： 通过消除 DFL 并精简网络架构，YOLO26 针对资源受限的边缘设备进行了深度优化，从简单的物联网传感器到 Raspberry Pi 开发板均适用。
ProgLoss + STAL： 这些先进的损失函数在小目标识别方面带来了显著提升，这对于分析航空影像和进行制造业自动化中的精确质量控制至关重要。

边缘优先优化

如果你的项目面向嵌入式系统或没有专用 GPU 的移动应用，YOLO26 的 CPU 性能优化提供了巨大的优势，其计算开销远低于前几代模型。

Link to this section性能与基准测试#

在评估生产环境模型时，分析精度、速度和计算复杂度之间的平衡至关重要。以下是针对图像尺寸为 640 像素（nano/tiny 版本为 416 像素）的标准模型进行的详细对比。

模型	尺寸 ^(像素)	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	参数量 ^(M)	FLOPs ^(B)
YOLOXnano	416	25.8	-	-	0.91	1.08
YOLOXtiny	416	32.8	-	-	5.06	6.45
YOLOXs	640	40.5	-	2.56	9.0	26.8
YOLOXm	640	46.9	-	5.43	25.3	73.8
YOLOXl	640	49.7	-	9.04	54.2	155.6
YOLOXx	640	51.1	-	16.1	99.1	281.9

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

如表所示，YOLO26 系列提供了更优的性能平衡。例如，YOLO26x 在参数量仅为 YOLOXx 模型约一半的情况下，达到了 57.5 mAP，这直接转化为更快的 GPU 推理速度（11.8 毫秒对比 16.1 毫秒）以及更卓越的部署灵活性。

Link to this section训练和生态系统体验#

这些架构之间最深刻的区别之一在于其易用性和生态系统支持。

虽然 YOLOX 仍然是研究梯度流和无锚点机制的研究人员的基础存储库，但其配置可能较为复杂，通常需要手动配置依赖项和算子。相比之下，Ultralytics 生态系统 定义了行业领先的易用性标准。

通过使用统一的 Python API，开发者可以极其简单地初始化、训练和部署 YOLO26 模型。该系统原生支持数据集下载、超参数调优，以及无缝导出为 ONNX、TensorRT 和 OpenVINO 等格式。

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

此外，与繁重的基于 Transformer 的替代方案相比，Ultralytics YOLO 模型在训练期间的内存需求明显更低，使工程师即使在消费级硬件上也能训练更大的批次。

Link to this section实际应用场景#

在 YOLOX 和 YOLO26 之间进行选择，最终取决于你的部署限制和多任务需求。

Link to this sectionYOLOX 的优势场景#

YOLOX 仍然是特定学术基准和深度集成 MegEngine 框架的遗留系统的可行选择。它的历史地位使其成为研究无锚点检测器和自定义分配策略的热门基准。

Link to this sectionYOLO26 的优势场景#

YOLO26 从根本上是为现代工业应用而设计的。因为它原生支持实例分割、姿态估计和旋转边界框 (OBB)，所以它比标准的检测引擎要通用得多。

智能零售和库存： 利用无需 NMS 的设计，确保自动化结账系统以超低延迟处理视频流，在没有后处理循环瓶颈的情况下识别产品。
无人机和航空分析： 针对 OBB 的专用角度损失以及 ProgLoss + STAL 的集成，使 YOLO26 在检测大范围卫星图像中的旋转物体和细小特征方面表现无可匹敌。
边缘安全系统： 凭借其快 43% 的 CPU 推理速度，YOLO26 允许公司直接在低成本的本地硬件上部署强大的安全分析功能，而无需昂贵的云端算力。

Link to this section应用场景与建议#

选择 YOLOX 还是 YOLO26 取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOX#

YOLOX 是以下场景的有力选择：

无锚点检测研究： 学术研究使用 YOLOX 简洁的无锚点架构作为基准，用于实验新的检测头或损失函数。
超轻量级边缘设备： 部署在微控制器或遗留移动硬件上，此时 YOLOX-Nano 变体极小的体积（0.91M 参数）至关重要。
SimOTA 标签分配研究： 探索基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 YOLO26#

建议在以下情况下选择 YOLO26：

无 NMS 的边缘部署： 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
仅 CPU 环境： 没有专用 GPU 加速的设备，YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
小目标检测： 具有挑战性的场景，如 aerial drone imagery 或 IoT 传感器分析，其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section探索其他 Ultralytics 模型#

如果你正在探索计算机视觉的演进，Ultralytics 系列中还有其他值得研究的高性能模型：

YOLO11： YOLO26 的前身，为稳定的生产环境提供了强大的性能和广泛的社区支持。
YOLOv8： 一个经过大量实战考验的架构，为成千上万个实际部署场景设定了易用性和灵活性的标准。

总之，虽然 YOLOX 为目标检测领域引入了关键概念，但全新的 YOLO26 在速度、精度和部署简洁性上实现了代际跨越，使其成为前瞻性开发者和企业的最终选择。

贡献者

GLglenn-jocher⁶

创建于 2026年1月14日更新于 3周前