YOLO26与YOLOYOLO111:端到端视觉AI的新纪元
物体检测技术的演进历程始终贯穿着对速度、精度与效率的不懈追求。在这条道路上,YOLO26与YOLO11堪称两大里程碑。 YOLO11。这两种模型均源自 Ultralytics,却代表着不同时代的架构哲学。本比较深入剖析了这两种架构的技术差异,帮助开发者和研究人员为其特定的计算机视觉应用选择合适的工具。
性能指标比较
下表突显了两个模型家族在COCO 上的性能差异。值得注意的是,YOLO26的CPU 速度实现了显著飞跃,这直接得益于其架构优化。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
架构演进
YOLO26:NMS革命
YOLO26于2026年1月发布,标志着向原生端到端目标检测的范式转变。与依赖启发式后处理步骤(如非最大NMS)过滤重复边界框的传统检测器不同,YOLO26将该逻辑直接融入网络架构。这一概念最初由 YOLOv10等研究中率先提出的概念,在YOLO26中已臻完善以确保生产环境的稳定性。
主要架构创新包括:
- 端到NMS:通过消除NMS,YOLO26简化了部署流程。这在边缘计算场景中尤为重要,NMS 波动性可能导致实时应用出现抖动。
- DFL移除:移除分布式焦点损失(DFL)可优化模型输出层结构。此项改进显著提升了模型与低功耗设备的兼容性,并简化了ONNX CoreML格式的导出流程,因其所需的自定义运算符数量大幅减少。
- MuSGD优化器:受大型语言模型(LLM)训练创新技术(如Moonshot AI的Kimi K2)启发,YOLO26采用融合SGD 混合优化器。该方案显著提升训练过程的稳定性,即使面对复杂数据集也能实现更快的收敛速度。
- 渐进损失(ProgLoss)与自训练锚损失(STAL)的引入显著提升了小目标检测性能。这些损失函数能在训练过程中动态调整关注点,确保更有效地学习困难样本——通常是小型或被遮挡的目标。
为什么CPU 很重要
上表显示,YOLO26n在CPU 上的推断速度达到38.9毫秒 CPU 56.1毫秒。 CPU 速度提升43%使消费级硬件能够实现实时分析,从而减少零售和物联网部署中对昂贵专用GPU的需求。
YOLO11:稳健标准
YOLO11于2024年9月发布的YOLOv8 基础上进行了升级YOLOv8 C3k2模块YOLOv8 SPPF(快速空间金字塔池化)模块YOLOv8 优化。尽管该模型仍具备强大的性能和鲁棒性,但其检测头仍采用传统的无锚点检测方案,需要NMS 进行优化。
YOLO11 在需要广泛支持旧系统或依赖前代特定架构特性的场景中YOLO11 。然而,相较于YOLO26的精简架构,其在后处理阶段存在略高的计算开销,这在高吞吐量环境中可能成为性能瓶颈。
理想用例
何时选择 YOLO26
YOLO26 是几乎所有新项目的推荐选择,尤其适用于优先考虑效率和部署便捷性的项目。
- 边缘AI与物联网:凭借其巨大的CPU 能力和NMS,YOLO26完美适用于树莓派或NVIDIA 等设备。较低的延迟波动对于机器人技术至关重要,因其控制回路需要稳定的时序精度。
- 复杂视觉任务:在检测之外,YOLO26针对特定任务进行了优化。例如,残差对数似然估计(RLE)显著提升了姿势估计 准确性,而专用的角度损失函数则增强了航空影像中定向边界框(旋转框检测) 姿势估计 识别精度。
- 低功耗应用:通过移除DFL并优化架构,YOLO26在每次推理中消耗更少能量,从而延长移动应用的电池续航时间。
何时选择 YOLO11
YOLO11 适用于以下情况:
- 遗留系统:若您现有的管道已针对YOLO11特定输出格式进行深度调优,且无法投入工程时间更新后处理逻辑(尽管通过Ultralytics迁移至YOLO26通常可无缝实现)。
- 基准基线:研究人员常采用YOLO11YOLO11 YOLOv8等广泛应用的模型 YOLOv8 作为基准模型,用于与新型架构进行对比。
Ultralytics 优势
无论您选择YOLO26还是YOLO11,Ultralytics 都能相较于竞争框架获得显著优势。
易用性与多功能性
Ultralytics 旨在提供"零基础到专家级"的使用体验。Python 即可支持检测、分割、分类 和追踪功能。这种多功能性使工程团队能够在不同任务间灵活切换,无需学习新的代码库。
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")
训练效率与内存
两种模型均针对训练效率进行了优化,但YOLO26采用的MuSGD优化器进一步稳定了训练过程。与需要大量显存的巨型transformer模型不同Ultralytics YOLO 通常可在消费级GPU上进行微调,从而使尖端人工智能技术得以普及。
维护良好的生态系统
Ultralytics 开源库确保您的项目具备前瞻性。凭借频繁更新、详尽文档以及数据集管理和云端训练工具,您将获得强大社区与活跃开发团队的全方位支持。
模型元数据
YOLO26
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- 文档:ultralytics
YOLO11
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- 文档:https://docs.ultralytics.com/models/yolo11/
结论
虽然 YOLO11 虽仍是强大可靠的模型,但YOLO26在效率与速度方面树立了全新标杆。其端到NMS设计,结合显著CPU 优化与先进损失函数,使其成为现代计算机视觉应用的优选方案。通过采用YOLO26,开发者能在保持用户Ultralytics 的前提下,以更低复杂度实现更高精度与更优性能。