跳转至内容

YOLO26与YOLO:实时目标检测的进化之路

计算机视觉领域发展迅猛,新型架构不断突破速度与精度的边界。该发展历程中的两大里程碑分别是:阿里巴巴集团于2022年末研发YOLO Ultralytics 发布的尖端模型YOLO26

YOLO YOLO 神经网络架构搜索(NAS)等创新概念,而YOLO26则实现了范式转变,转向原生端到端处理与边缘优先设计。本文通过详细对比这两款强大模型的架构差异、性能指标及部署实践,助力开发者为目标检测需求选择合适工具。

性能指标比较

下表对比YOLO性能表现。值得注意的是,在推理速度方面取得了显著提升,尤其体现在CPU运算上,这正是YOLO26架构的显著优势。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics :新标准

由Ultralytics于2026年1月发布的YOLO26,在YOLO11的基础上进行了升级。 YOLO11YOLOv8的传统,对检测流程进行了根本性变革。其核心设计理念在于消除部署与训练环节的瓶颈,使其成为高端GPU与资源受限的边缘设备上最高效的模型。

主要创新

  1. NMS:与前代产品及YOLO竞争对手不同,YOLO26天生具备端到端特性。它消除了对非最大抑制(NMS)后处理的需求,从而降低延迟波动并简化部署流程——这一突破性方案最早由 YOLOv10
  2. MuSGD优化器:受大型语言模型(LLM)训练领域最新进展的启发,YOLO26采用SGD 的混合优化方案。该优化器在训练过程中提供更高的稳定性与更快的收敛速度,从而降低达到最佳精度所需的计算成本。
  3. 边缘优先优化:通过移除分布式焦点损失(DFL),模型架构得以简化,便于导出ONNX CoreML格式。相较于前代版本,此举 CPU 大幅提升43%,使其成为树莓派或手机等设备的理想选择。
  4. 增强的小目标检测:ProgLoss与STAL(尺度感知训练自适应损失)的融合显著提升了对小目标的检测性能,弥补了单阶段检测器普遍存在的弱点。

简化部署

由于YOLO26NMS 导出的模型是纯粹的神经网络,不含复杂的后处理代码。这使得模型集成到C++或移动端环境变得显著简便,且不易引发逻辑错误。

代码示例

YOLO26的用户体验始终与精简Ultralytics Python 保持一致。

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

了解更多关于 YOLO26 的信息

YOLO:NAS驱动的挑战者

由阿里巴巴达摩院研发YOLO于2022年引发热议,其突破性在于运用神经网络架构搜索(NAS)技术设计主干网络。研究者摒弃了人工构建网络结构的方式,转而采用辅助边方法(MAE-NAS)在特定延迟约束下自动发现高效架构。

主要功能

  • MAE-NAS骨干网络:通过数学优化实现网络结构,在最大化信息流的同时最小化计算成本。
  • RepGFPN:一种高效的特征金字塔网络,通过重新参数化技术提升不同尺度间的特征融合效果。
  • 零头:一种轻量级检测头设计,旨在减少网络末端的参数数量。
  • 对齐式OTA:一种标签分配策略,旨在帮助模型在训练过程中更好地理解哪些锚框对应于真实目标。

YOLO 在当时YOLO 卓越YOLO 其依赖复杂的蒸馏训练管道——即由大型教师模型指导小型学生模型——使得定制化训练相较Ultralytics "从零开始训练"能力,更耗费资源。

详细比较

架构与培训稳定性

最显著的差异在于优化方法。YOLO 寻找最优结构,虽然能实现高效的理论浮点运算性能,但往往导致架构难以修改或调试。

相反,YOLO26采用手工打造、基于直觉的架构改进(如移除DFL和NMS预测头),并通过MuSGD优化器加以强化。该优化器将大型语言模型中常见的稳定性引入计算机视觉领域。对开发者而言,这意味着YOLO26对超参数调优的敏感度降低,能在自定义数据集上实现可靠收敛。

推理速度与资源效率

YOLO 通过TensorRT GPU ,而YOLO26则采取更广泛的策略。NMS 移除DFLNMS YOLO26在CPU上 NMS 优异NMS 速度比前代提升高达43%。这对零售分析或智慧城市等应用至关重要——这些场景中的边缘设备可能不配备专用GPU。

此外,YOLO26在训练过程中的内存需求通常较低。YOLO 需要训练一个庞大的教师模型进行知识蒸馏才能达到最佳效果,而YOLO26能直接实现最先进水平的结果,从而节省大量GPU 电力消耗。

多功能性与生态系统

Ultralytics 的一大优势在于其多功能性。YOLO 目标检测器YOLO 。相比之下,YOLO26架构原生支持多种计算机视觉任务,包括:

这使得单个开发团队能够使用单一API和单一框架解决多个不同问题,从而大幅减少技术债务。

功能对比表

特性YOLO26DAMO-YOLO
发布日期2026年1月2022 年 11 月
架构端到端,NMS基于NAS的,无锚点
后处理无(模型输出 = 最终结果)非极大值抑制 (NMS)
优化器MuSGD(SGD 缪子)SGD AdamW
培训流程单阶段,从零开始训练复杂蒸馏(师生)
支持的任务detect、segment、姿势估计、旋转框检测、classify检测
边缘优化高(无DFL,CPU优化)中等(TensorRT )

结论

这两种架构都代表了目标检测技术发展史上的重要里程碑。YOLO 自动架构搜索与重新参数化的强大能力,而YOLO26则代表了未来人工智能实际部署的发展方向。

通过消除NMS 、引入MuSGD等大型语言模型级优化器,并为分割、姿势估计和检测提供统一解决方案Ultralytics 性能与易用性的卓越平衡。对于开发工业自动化到移动应用等实际应用的开发者而言,其强大的生态系统、详尽的文档以及Ultralytics 使YOLO26成为不二之选。

若您对其他对比方案感兴趣,可探索YOLO11 YOLOYOLO11 ,或研究transformer替代方案,例如 RT-DETR

作者与参考文献

YOLO26

DAMO-YOLO

  • 作者:徐宪哲、江一琪、陈伟华、黄一伦、张远、孙秀宇
  • 组织: 阿里巴巴集团
  • 日期: 2022-11-23
  • 论文:arXiv:2211.15444

评论