跳转至内容

YOLOv10 对比 YOLO26:一项比较分析

在实时目标检测快速发展的领域中,开发者和研究人员不断寻求推理速度、精度和部署灵活性之间的最佳平衡。这一旅程中的两个重要里程碑是清华大学开发的YOLOv10,以及随后Ultralytics的最新旗舰模型YOLO26

尽管这两种模型都倡导向端到端架构发展,但它们在实现方式、生态系统支持和目标应用方面存在显著差异。本分析将详细阐述这两种强大视觉AI工具之间的架构转变、性能指标和实际选择考量。

模型概述

YOLOv10:端到端先驱

由清华大学研究人员于2024年5月发布,YOLOv10因引入了一种用于无NMS训练的一致双重分配策略而备受关注。这种架构旨在消除非极大值抑制 (NMS) 后处理步骤,该步骤在以往的YOLO版本中一直是延迟瓶颈。

  • 作者: Ao Wang, Hui Chen, Lihao Liu, et al.
  • 组织:清华大学
  • 日期:2024年5月23日
  • 关键创新:用于无NMS训练的一致双重分配,以及整体效率-精度驱动的模型设计。

了解更多关于 YOLOv10

YOLO26:边缘 AI 的新标准

由Ultralytics于2026年1月发布,YOLO26完善了YOLOv10开创的端到端概念,但重新构建了框架,重点关注边缘部署、训练稳定性和硬件兼容性。它移除了像分布焦点损失 (DFL) 这样的传统组件,以简化可导出性,并引入了受大型语言模型 (LLM) 启发的优化技术。

  • 作者:Glenn Jocher 和 Jing Qiu
  • 组织:Ultralytics
  • 日期:2026 年 1 月 14 日
  • 关键创新:移除DFL,MuSGD优化器(SGD/Muon混合),以及对五种计算机视觉任务的原生端到端支持。

了解更多关于 YOLO26 的信息

架构差异

从YOLOv10到YOLO26的转变代表了从学术创新到生产级鲁棒性的转变。

端到端设计与 NMS

两种模型都旨在移除NMS。YOLOv10引入了双重标签分配的概念——即在训练期间使用一对多分配进行丰富监督,在推理时使用一对一分配。

YOLO26采用了这种原生端到端无NMS设计,但优化了实现,以确保与Ultralytics生态系统的无缝集成。通过直接生成预测而无需后处理,两种模型都减少了延迟的可变性,这对于自动驾驶汽车和机器人等实时应用至关重要。

损失函数与优化

一个主要区别在于模型的训练方式。

  • YOLOv10专注于架构的效率-精度驱动设计,优化特定组件以减少计算开销。
  • YOLO26引入了MuSGD优化器,它是SGD和Muon优化器(灵感来自月之暗面的Kimi K2)的混合体。这将大型语言模型 (LLM) 训练中的优化技术引入计算机视觉领域,从而实现更快的收敛和更高的稳定性。此外,YOLO26还利用了ProgLossSTAL(小目标感知标签分配),专门针对小目标识别的改进。

简洁性与可导出性

YOLO26迈出了激进的一步,移除了分布焦点损失 (DFL)。尽管DFL在早期版本中有助于提高边界框精度,但它常常使模型导出到ONNX或TensorRT等格式的过程复杂化,尤其是在边缘设备上。YOLO26中移除DFL简化了模型图,使其在CPU推理速度上比前代产品快高达43%,使其在边缘计算方面表现出极高的效率。

性能对比

下表重点介绍了两种模型的性能指标。尽管YOLOv10提供了强大的性能,YOLO26则展现出卓越的速度,尤其是在CPU环境下,并在大型模型中提高了精度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

主要内容

  1. CPU效率: YOLO26 提供经过验证的高度优化的 CPU 推理速度,这对于缺乏专用 GPU 的设备(例如 Raspberry Pi 或标准笔记本电脑)至关重要。
  2. 精度提升: 总体而言,YOLO26 实现了更高的 mAP 分数,尤其在中型 (m)、大型 (l) 和超大型 (x) 变体中表现出显著提升。
  3. 参数效率: 虽然 YOLOv10 旨在实现低参数量,但 YOLO26 优化了 FLOPs 和架构,以在实际场景中为每个计算单元提供更好的 mAP。

生态系统与易用性

在为生产环境选择模型时,其生态系统与架构本身同样重要。

Ultralytics 优势

YOLO26 受益于成熟的 Ultralytics 生态系统。这包括:

  • 统一 API: 用于训练、验证和部署的一致的 Python 和 CLI 接口。
  • 文档: 关于与 Weights & Biases、Comet 和 Roboflow 等工具集成的详尽指南。
  • 多功能性: 与主要侧重于 detect 的 YOLOv10 不同,YOLO26 在同一框架内原生支持实例 segment姿势估计旋转框检测 (OBB)和分类。
  • 支持: 通过 GitHub、Discord 和 Ultralytics 社区论坛提供活跃的社区支持。

任务灵活性

如果您的项目需要的不仅仅是边界框——例如理解身体姿势(姿势估计)或 segment 不规则对象(segment)——YOLO26 通过相同的简单 API 提供这些开箱即用的功能。

训练效率

与大量使用 Transformer 的架构相比,YOLO26 模型在训练期间通常需要更少的内存。MuSGD 优化器的引入进一步稳定了训练过程,减少了可能困扰实验模型的损失发散或“NaN”错误的发生几率。用户只需一个命令即可轻松开始训练:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

应用案例

何时选择 YOLOv10

对于专门研究效率-精度驱动设计理论极限的学术研究人员,或希望在原始双分配研究基础上进行开发的学者而言,YOLOv10 仍然是一个强有力的选择。其“nano”版本中较低的参数量在高度受限的理论基准测试中表现出色。

何时选择 YOLO26

YOLO26 是为构建实际应用的开发人员、工程师和企业推荐的选择。

  • 边缘部署: DFL 的移除和对 CPU 推理的优化使其成为移动应用和物联网设备的理想选择。
  • 复杂场景: ProgLoss 函数和 STAL 在涉及小目标(例如无人机图像或卫星分析)的场景中提供了显著优势。
  • 多任务需求: 最终可能需要 segment 或姿势估计的项目,可以在不切换库的情况下,继续使用相同的代码库。
  • 生产稳定性: 对 ONNX、TensorRT、CoreML 和 OpenVINO 的强大导出支持确保了您训练的模型就是您可以部署的模型。

结论

虽然 YOLOv10 向大众介绍了无 NMS detect 的激动人心的可能性,但 YOLO26 则对此技术进行了完善和实际应用。通过将端到端设计与先进的受 LLM 启发的优化器、任务多功能性以及 Ultralytics 平台的强大支持相结合,YOLO26 在 2026 年成为实用、高性能计算机视觉开发的卓越选择。

对于希望探索类似先进选项的开发人员,YOLO11 模型也提供了出色的性能,并为传统工作流提供全面支持。


评论