跳转至内容

Ultralytics YOLO26

即将推出 ⚠️

🚧 YOLO26 模型仍在开发中,尚未发布。此处显示的的性能数据仅为预览。 最终下载和发布即将推出 —— 请通过 YOLO Vision 2025 保持关注。

概述

Ultralytics YOLO26 是 YOLO 系列实时对象检测器的最新演进,从头开始专为边缘和低功耗设备而设计。它引入了简化的设计,消除了不必要的复杂性,同时集成了有针对性的创新,以实现更快、更轻、更易于访问的部署。

YOLO26 的架构遵循三个核心原则:

  • 简洁性: YOLO26 是一个原生端到端模型,直接生成预测,而无需非极大值抑制 (NMS)。通过消除此后处理步骤,推理变得更快、更轻,并且更易于在实际系统中部署。清华大学的 Ao Wang 在 YOLOv10 中首次开创了这种突破性方法,并在 YOLO26 中得到了进一步发展。
  • 部署效率: 端到端设计消除了管道的整个阶段,从而大大简化了集成,减少了延迟,并使部署在各种环境中更加稳健。
  • 训练创新: YOLO26 引入了 MuSGD 优化器,它是 SGDMuon 的混合体 — 受 Moonshot AI 的 Kimi K2 在 LLM 训练方面的突破启发。该优化器带来了增强的稳定性和更快的收敛速度,从而将语言模型的优化进展转移到计算机视觉中。

这些创新共同提供了一个模型系列,该模型系列在小对象上实现了更高的精度,提供了无缝部署,并且在 CPU 上的运行速度提高了 43% — 使 YOLO26 成为迄今为止资源受限环境中最实用和可部署的 YOLO 模型之一。

Ultralytics YOLO26 比较图

主要功能

  • DFL 移除
    分布焦点损失 (DFL) 模块虽然有效,但通常会使导出复杂化并限制硬件兼容性。YOLO26 完全移除了 DFL,从而简化了推理并扩大了对边缘和低功耗设备的支持。

  • 端到端无 NMS 推理
    与依赖 NMS 作为单独后处理步骤的传统检测器不同,YOLO26 是原生端到端的。直接生成预测,从而减少了延迟,并使集成到生产系统中的速度更快、更轻且更可靠。

  • ProgLoss + STAL
    改进的损失函数提高了检测精度,尤其是在小对象识别方面,这是物联网、机器人技术、航空图像和其他边缘应用的关键要求。

  • MuSGD 优化器
    一种新的混合优化器,它将 SGDMuon 相结合。受 Moonshot AI 的 Kimi K2 的启发,MuSGD 将 LLM 训练中的高级优化方法引入到计算机视觉中,从而实现更稳定的训练和更快的收敛。

  • CPU 推理速度提高高达 43%
    YOLO26 专为边缘计算而优化,可显著加快 CPU 推理速度,从而确保在没有 GPU 的设备上实现实时性能。


支持的任务和模式

YOLO26 被设计为一个多任务模型系列,将 YOLO 的多功能性扩展到各种计算机视觉挑战中:

模型 任务 推理 验证 训练 导出
YOLO26 检测
YOLO26-seg 实例分割
YOLO26-姿势估计 姿势/关键点
YOLO26-旋转框检测 定向检测
YOLO26-cls 分类

这种统一的框架确保 YOLO26 适用于实时检测、分割、分类、姿势估计和定向对象检测,所有这些都支持训练、验证、推理和导出。


性能指标

性能预览

以下基准是早期预览。最终数据和可下载的权重将在训练完成后发布。

COCO 上使用 80 个预训练类别进行训练。 模型发布后,请参阅检测文档以了解使用方法。

模型 尺寸
(像素)
mAPval
50-95(e2e)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO26n 640 39.8 40.3 38.90 ± 0.7 1.7 ± 0.0 2.4 5.4
YOLO26s 640 47.2 47.6 87.16 ± 0.9 2.7 ± 0.0 9.5 20.7
YOLO26m 640 51.5 51.7 220.0 ± 1.4 4.9 ± 0.1 20.4 68.2
YOLO26l 640 53.0* 53.4* 286.17 ± 2.0* 6.5 ± 0.2* 24.8 86.4
YOLO26x 640 - - - - - -

*YOLO26l 和 YOLO26x 的指标正在进行中。最终基准将在此处添加。

性能指标即将推出。

性能指标即将推出。

性能指标即将推出。

性能指标即将推出。


引用与致谢

Ultralytics YOLO26 发布

由于模型快速发展的特性,Ultralytics 尚未发布 YOLO26 的正式研究论文。相反,我们专注于提供最先进的模型并使其易于使用。有关 YOLO 功能、架构和用法的最新更新,请访问我们的 GitHub 存储库文档

如果您在工作中使用 YOLO26 或其他 Ultralytics 软件,请引用它:

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2025},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI 待定。YOLO26 在 AGPL-3.0Enterprise 许可下可用。


常见问题

与 YOLO11 相比,YOLO26 的主要改进是什么?

  • DFL 移除:简化导出并扩展边缘兼容性
  • 端到端无 NMS 推理:消除 NMS 以实现更快、更简单的部署
  • ProgLoss + STAL:提高准确性,尤其是在小物体上
  • MuSGD 优化器:结合 SGD 和 Muon(灵感来自 Moonshot 的 Kimi K2),以实现更稳定、高效的训练
  • CPU 推理速度提高高达 43%:CPU 设备的主要性能提升

YOLO26 将支持哪些任务?

YOLO26 被设计为一个 统一模型系列,为多个计算机视觉任务提供端到端支持:

每个尺寸变体(n、s、m、l、x)都计划在发布时支持所有任务。

为什么 YOLO26 针对边缘部署进行了优化?

YOLO26 提供 最先进的边缘性能,具有:

  • CPU 推理速度提高高达 43%
  • 减小的模型尺寸和内存占用
  • 架构简化以实现兼容性(无 DFL,无 NMS)
  • 灵活的导出格式,包括 TensorRT、ONNX、CoreML、TFLite 和 OpenVINO

YOLO26 模型何时可用?

YOLO26 模型仍在训练中,尚未开源。此处显示了性能预览,官方下载和发布计划在不久的将来进行。 请参阅 YOLO Vision 2025 以了解 YOLO26 的讨论。



📅创建于 21 天前 ✏️2 天前已更新

评论