YOLO26与YOLOYOLO111：端到端视觉AI的新纪元

物体检测技术的演进历程始终贯穿着对速度、精度与效率的不懈追求。在这条道路上，YOLO26与YOLO11堪称两大里程碑。 YOLO11。这两种模型均源自 Ultralytics，却代表着不同时代的架构哲学。本比较深入剖析了这两种架构的技术差异，帮助开发者和研究人员为其特定的计算机视觉应用选择合适的工具。

性能指标比较

下表突显了两个模型家族在COCO 上的性能差异。值得注意的是，YOLO26的CPU 速度实现了显著飞跃，这直接得益于其架构优化。

模型	尺寸 ^(像素)	mAP^val 50-95	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

架构演进

YOLO26：NMS革命

YOLO26于2026年1月发布，标志着向原生端到端目标检测的范式转变。与依赖启发式后处理步骤（如非最大NMS）过滤重复边界框的传统检测器不同，YOLO26将该逻辑直接融入网络架构。这一概念最初由 YOLOv10等研究中率先提出的概念，在YOLO26中已臻完善以确保生产环境的稳定性。

主要架构创新包括：

端到NMS：通过消除NMS，YOLO26简化了部署流程。这在边缘计算场景中尤为重要，NMS 波动性可能导致实时应用出现抖动。
DFL移除：移除分布式焦点损失（DFL）可优化模型输出层结构。此项改进显著提升了模型与低功耗设备的兼容性，并简化了ONNX CoreML格式的导出流程，因其所需的自定义运算符数量大幅减少。
MuSGD优化器：受大型语言模型（LLM）训练创新技术（如Moonshot AI的Kimi K2）启发，YOLO26采用融合SGD 混合优化器。该方案显著提升训练过程的稳定性，即使面对复杂数据集也能实现更快的收敛速度。
渐进损失（ProgLoss）与自训练锚损失（STAL）的引入显著提升了小目标检测性能。这些损失函数能在训练过程中动态调整关注点，确保更有效地学习困难样本——通常是小型或被遮挡的目标。

为什么CPU 很重要

上表显示，YOLO26n在CPU 上的推断速度达到38.9毫秒 CPU 56.1毫秒。 CPU 速度提升43%使消费级硬件能够实现实时分析，从而减少零售和物联网部署中对昂贵专用GPU的需求。

了解更多关于 YOLO26 的信息

YOLO11：稳健标准

YOLO11于2024年9月发布的YOLOv8 基础上进行了升级YOLOv8 C3k2模块YOLOv8 SPPF（快速空间金字塔池化）模块YOLOv8 优化。尽管该模型仍具备强大的性能和鲁棒性，但其检测头仍采用传统的无锚点检测方案，需要NMS 进行优化。

YOLO11 在需要广泛支持旧系统或依赖前代特定架构特性的场景中YOLO11 。然而，相较于YOLO26的精简架构，其在后处理阶段存在略高的计算开销，这在高吞吐量环境中可能成为性能瓶颈。

了解更多关于 YOLO11 的信息

理想用例

何时选择 YOLO26

YOLO26 是几乎所有新项目的推荐选择，尤其适用于优先考虑效率和部署便捷性的项目。

边缘AI与物联网：凭借其巨大的CPU 能力和NMS，YOLO26完美适用于树莓派或NVIDIA 等设备。较低的延迟波动对于机器人技术至关重要，因其控制回路需要稳定的时序精度。
复杂视觉任务：在检测之外，YOLO26针对特定任务进行了优化。例如，残差对数似然估计（RLE）显著提升了姿势估计准确性，而专用的角度损失函数则增强了航空影像中定向边界框（旋转框检测）姿势估计识别精度。
低功耗应用：通过移除DFL并优化架构，YOLO26在每次推理中消耗更少能量，从而延长移动应用的电池续航时间。

何时选择 YOLO11

YOLO11 适用于以下情况：

遗留系统：若您现有的管道已针对YOLO11特定输出格式进行深度调优，且无法投入工程时间更新后处理逻辑（尽管通过Ultralytics迁移至YOLO26通常可无缝实现）。
基准基线：研究人员常采用YOLO11YOLO11 YOLOv8等广泛应用的模型 YOLOv8 作为基准模型，用于与新型架构进行对比。

Ultralytics 优势

无论您选择YOLO26还是YOLO11，Ultralytics 都能相较于竞争框架获得显著优势。

易用性与多功能性

Ultralytics 旨在提供"零基础到专家级"的使用体验。Python 即可支持检测、分割、分类和追踪功能。这种多功能性使工程团队能够在不同任务间灵活切换，无需学习新的代码库。

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")

训练效率与内存

两种模型均针对训练效率进行了优化，但YOLO26采用的MuSGD优化器进一步稳定了训练过程。与需要大量显存的巨型transformer模型不同Ultralytics YOLO 通常可在消费级GPU上进行微调，从而使尖端人工智能技术得以普及。

维护良好的生态系统

Ultralytics 开源库确保您的项目具备前瞻性。凭借频繁更新、详尽文档以及数据集管理和云端训练工具，您将获得强大社区与活跃开发团队的全方位支持。

模型元数据

YOLO26

作者：Glenn Jocher 和 Jing Qiu
组织：Ultralytics
日期： 2026-01-14
GitHub:https://github.com/ultralytics/ultralytics
文档：ultralytics

YOLO11

作者：Glenn Jocher 和 Jing Qiu
组织：Ultralytics
日期： 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
文档：https://docs.ultralytics.com/models/yolo11/

探索其他模型

对于有兴趣探索不同架构的用户Ultralytics 支持 RT-DETR 用于transformer检测，以及SAM 用于零样本分割任务。

结论

虽然 YOLO11 虽仍是强大可靠的模型，但YOLO26在效率与速度方面树立了全新标杆。其端到NMS设计，结合显著CPU 优化与先进损失函数，使其成为现代计算机视觉应用的优选方案。通过采用YOLO26，开发者能在保持用户Ultralytics 的前提下，以更低复杂度实现更高精度与更优性能。