Ultralytics YOLO26
即将推出 ⚠️
🚧 YOLO26 模型仍在开发中,尚未发布。此处显示的的性能数据仅为预览。 最终下载和发布即将推出 —— 请通过 YOLO Vision 2025 保持关注。
概述
Ultralytics YOLO26 是 YOLO 系列实时对象检测器的最新演进,从头开始专为边缘和低功耗设备而设计。它引入了简化的设计,消除了不必要的复杂性,同时集成了有针对性的创新,以实现更快、更轻、更易于访问的部署。
YOLO26 的架构遵循三个核心原则:
- 简洁性: YOLO26 是一个原生端到端模型,直接生成预测,而无需非极大值抑制 (NMS)。通过消除此后处理步骤,推理变得更快、更轻,并且更易于在实际系统中部署。清华大学的 Ao Wang 在 YOLOv10 中首次开创了这种突破性方法,并在 YOLO26 中得到了进一步发展。
- 部署效率: 端到端设计消除了管道的整个阶段,从而大大简化了集成,减少了延迟,并使部署在各种环境中更加稳健。
- 训练创新: YOLO26 引入了 MuSGD 优化器,它是 SGD 和 Muon 的混合体 — 受 Moonshot AI 的 Kimi K2 在 LLM 训练方面的突破启发。该优化器带来了增强的稳定性和更快的收敛速度,从而将语言模型的优化进展转移到计算机视觉中。
这些创新共同提供了一个模型系列,该模型系列在小对象上实现了更高的精度,提供了无缝部署,并且在 CPU 上的运行速度提高了 43% — 使 YOLO26 成为迄今为止资源受限环境中最实用和可部署的 YOLO 模型之一。
主要功能
-
DFL 移除
分布焦点损失 (DFL) 模块虽然有效,但通常会使导出复杂化并限制硬件兼容性。YOLO26 完全移除了 DFL,从而简化了推理并扩大了对边缘和低功耗设备的支持。 -
端到端无 NMS 推理
与依赖 NMS 作为单独后处理步骤的传统检测器不同,YOLO26 是原生端到端的。直接生成预测,从而减少了延迟,并使集成到生产系统中的速度更快、更轻且更可靠。 -
ProgLoss + STAL
改进的损失函数提高了检测精度,尤其是在小对象识别方面,这是物联网、机器人技术、航空图像和其他边缘应用的关键要求。 -
MuSGD 优化器
一种新的混合优化器,它将 SGD 与 Muon 相结合。受 Moonshot AI 的 Kimi K2 的启发,MuSGD 将 LLM 训练中的高级优化方法引入到计算机视觉中,从而实现更稳定的训练和更快的收敛。 -
CPU 推理速度提高高达 43%
YOLO26 专为边缘计算而优化,可显著加快 CPU 推理速度,从而确保在没有 GPU 的设备上实现实时性能。
支持的任务和模式
YOLO26 被设计为一个多任务模型系列,将 YOLO 的多功能性扩展到各种计算机视觉挑战中:
模型 | 任务 | 推理 | 验证 | 训练 | 导出 |
---|---|---|---|---|---|
YOLO26 | 检测 | ✅ | ✅ | ✅ | ✅ |
YOLO26-seg | 实例分割 | ✅ | ✅ | ✅ | ✅ |
YOLO26-姿势估计 | 姿势/关键点 | ✅ | ✅ | ✅ | ✅ |
YOLO26-旋转框检测 | 定向检测 | ✅ | ✅ | ✅ | ✅ |
YOLO26-cls | 分类 | ✅ | ✅ | ✅ | ✅ |
这种统一的框架确保 YOLO26 适用于实时检测、分割、分类、姿势估计和定向对象检测,所有这些都支持训练、验证、推理和导出。
性能指标
性能预览
以下基准是早期预览。最终数据和可下载的权重将在训练完成后发布。
在 COCO 上使用 80 个预训练类别进行训练。 模型发布后,请参阅检测文档以了解使用方法。
模型 | 尺寸 (像素) |
mAPval 50-95(e2e) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|---|
YOLO26n | 640 | 39.8 | 40.3 | 38.90 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
YOLO26s | 640 | 47.2 | 47.6 | 87.16 ± 0.9 | 2.7 ± 0.0 | 9.5 | 20.7 |
YOLO26m | 640 | 51.5 | 51.7 | 220.0 ± 1.4 | 4.9 ± 0.1 | 20.4 | 68.2 |
YOLO26l | 640 | 53.0* | 53.4* | 286.17 ± 2.0* | 6.5 ± 0.2* | 24.8 | 86.4 |
YOLO26x | 640 | - | - | - | - | - | - |
*YOLO26l 和 YOLO26x 的指标正在进行中。最终基准将在此处添加。
性能指标即将推出。
性能指标即将推出。
性能指标即将推出。
性能指标即将推出。
引用与致谢
Ultralytics YOLO26 发布
由于模型快速发展的特性,Ultralytics 尚未发布 YOLO26 的正式研究论文。相反,我们专注于提供最先进的模型并使其易于使用。有关 YOLO 功能、架构和用法的最新更新,请访问我们的 GitHub 存储库 和 文档。
如果您在工作中使用 YOLO26 或其他 Ultralytics 软件,请引用它:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2025},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}
DOI 待定。YOLO26 在 AGPL-3.0 和 Enterprise 许可下可用。
常见问题
与 YOLO11 相比,YOLO26 的主要改进是什么?
- DFL 移除:简化导出并扩展边缘兼容性
- 端到端无 NMS 推理:消除 NMS 以实现更快、更简单的部署
- ProgLoss + STAL:提高准确性,尤其是在小物体上
- MuSGD 优化器:结合 SGD 和 Muon(灵感来自 Moonshot 的 Kimi K2),以实现更稳定、高效的训练
- CPU 推理速度提高高达 43%:CPU 设备的主要性能提升
YOLO26 将支持哪些任务?
YOLO26 被设计为一个 统一模型系列,为多个计算机视觉任务提供端到端支持:
每个尺寸变体(n、s、m、l、x)都计划在发布时支持所有任务。
为什么 YOLO26 针对边缘部署进行了优化?
YOLO26 提供 最先进的边缘性能,具有:
- CPU 推理速度提高高达 43%
- 减小的模型尺寸和内存占用
- 架构简化以实现兼容性(无 DFL,无 NMS)
- 灵活的导出格式,包括 TensorRT、ONNX、CoreML、TFLite 和 OpenVINO
YOLO26 模型何时可用?
YOLO26 模型仍在训练中,尚未开源。此处显示了性能预览,官方下载和发布计划在不久的将来进行。 请参阅 YOLO Vision 2025 以了解 YOLO26 的讨论。