Ultralytics YOLO26
概述
Ultralytics YOLO26 是 YOLO 系列实时目标检测器的最新演进,专为边缘和低功耗设备从零构建。它引入了精简设计,去除了不必要的复杂性,同时整合了针对性创新,从而实现更快、更轻量且更易于部署的效果。

直接在 Ultralytics Platform 上探索并运行 YOLO26 模型。
YOLO26 的架构遵循三个核心原则:
- 简洁性: YOLO26 是一种原生端到端模型,直接生成预测结果,无需非极大值抑制(NMS)。通过消除这一后处理步骤,推理变得更快、更轻量,且更易于在实际系统中部署。这种突破性的方法最初由清华大学的王傲在 YOLOv10 中首创,并在 YOLO26 中得到了进一步优化。
- 部署效率: 端到端设计省去了整个流程中的一个阶段,极大简化了集成,降低了延迟,并使部署在各种环境下更加稳健。
- 训练创新: YOLO26 引入了 MuSGD 优化器,这是 SGD 和 Muon 的混合体,灵感源自月之暗面 (Moonshot AI) 的 Kimi K2 在大语言模型训练中的突破。该优化器带来了更强的稳定性和更快的收敛速度,将大语言模型的优化进展应用到了计算机视觉领域。
- 特定任务优化: YOLO26 为专业任务引入了针对性改进,包括用于语义分割的语义分割损失和多尺度 proto 模块、用于高精度姿态估计的残差对数似然估计(RLE),以及通过角度损失优化解码以解决 OBB 边界问题。
这些创新共同构建了一个模型家族,在处理小目标时实现了更高的准确度,提供了无缝的部署体验,并且在 CPU 上运行速度提升高达 43% — 使 YOLO26 成为目前资源受限环境下最实用、最易部署的 YOLO 模型之一。
主要特性
-
移除 DFL 分布焦点损失(DFL)模块虽然有效,但往往会使导出复杂化并限制硬件兼容性。YOLO26 完全移除了 DFL,简化了推理过程,并拓宽了对边缘和低功耗设备的支持。
-
端到端无需 NMS 的推理 与依赖 NMS 作为独立后处理步骤的传统检测器不同,YOLO26 是原生端到端的。预测结果直接生成,降低了延迟,并使集成到生产系统中的过程变得更快、更轻量且更可靠。
-
ProgLoss + STAL 改进的损失函数提高了检测精度,特别是在小目标识别方面有显著提升,这对于物联网、机器人、航空影像及其他边缘应用至关重要。
-
MuSGD 优化器 一种结合了 SGD 与 Muon 的新型混合优化器。受月之暗面 (Moonshot AI) 的 Kimi K2 启发,MuSGD 将大语言模型训练中的先进优化方法引入计算机视觉,从而实现更稳定的训练和更快的收敛。
-
CPU 推理速度提升高达 43% 专为边缘计算优化,YOLO26 显著提升了 CPU 推理速度,确保在没有 GPU 的设备上也能实现实时性能。
-
实例分割增强 引入语义分割损失以改进模型收敛,并升级了 proto 模块,利用多尺度信息实现卓越的掩膜质量。
-
高精度姿态估计 集成了 残差对数似然估计 (RLE) 以实现更精确的关键点定位,并优化了解码过程以提高推理速度。
-
精炼的 OBB 解码 引入专门的角度损失以提高正方形物体的检测精度,并优化了 OBB 解码以解决边界不连续的问题。

支持的任务和模式
YOLO26 构建在早期 Ultralytics YOLO 版本所建立的多功能模型范围之上,为各种计算机视觉任务提供了增强支持:
| 模型 | 文件名 | 任务 | 推理 | 验证 | 训练 | 导出 |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | 检测 | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | 实例分割 | ✅ | ✅ | ✅ | ✅ |
| YOLO26-sem | yolo26n-sem.pt yolo26s-sem.pt yolo26m-sem.pt yolo26l-sem.pt yolo26x-sem.pt | 语义分割 | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | 姿态/关键点 | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | 旋转目标检测 | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | 分类 | ✅ | ✅ | ✅ | ✅ |
这一统一框架确保了 YOLO26 可广泛应用于实时检测、实例分割、语义分割、分类、姿态估计和旋转目标检测,且所有这些任务均支持训练、验证、推理和导出。
yolo26-p2.yaml 和 yolo26-p6.yaml 添加了 P2(小目标)或 P6(大输入)检测头,仅作为 YAML 架构发布。未发布特定规模的 yolo26*-p2.pt 或 yolo26*-p6.pt 权重。请从 YAML 实例化比例配置(例如 YOLO("yolo26n-p6.yaml")),并根据需要进行训练或微调。
性能指标
查看 检测文档 以获取这些在 COCO 上训练的模型的使用示例,其中包含 80 个预训练类别。
| 模型 | 尺寸 (像素) | mAPval 50-95 | mAPval 50-95(e2e) | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Params 和 FLOPs 数值是针对 model.fuse() 后的融合模型,该操作合并了 Conv 和 BatchNorm 层并移除了辅助的一对多检测头。预训练检查点保留了完整的训练架构,可能会显示更高的数值。
使用示例
本节提供简单的 YOLO26 训练和推理示例。有关这些模式以及其他 模式 的完整文档,请参阅 预测、训练、验证 和 导出 文档页面。
请注意,以下示例适用于 YOLO26 检测 模型,用于 目标检测。如需了解其他支持的任务,请参阅 分割、语义分割、分类、旋转框检测 和 姿态估计 文档。
PyTorch 预训练的 *.pt 模型以及配置 *.yaml 文件可以传递给 YOLO() 类,以便在 Python 中创建模型实例:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")YOLO26 采用 双头架构,为不同的部署场景提供了灵活性:
- 一对一头 (默认):产生端到端的预测,无需 NMS,输出
(N, 300, 6),每张图像最多 300 个检测结果。此头部针对快速推理和简化部署进行了优化。 - 一对多头:生成传统的 YOLO 输出,需要 NMS 后处理,输出
(N, nc + 4, 8400),其中nc是类别数量。此头部通常以额外的处理成本为代价获得略高的准确率。
你可以在导出、预测或验证过程中切换头部:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # export选择取决于你的部署需求:为了极致的速度和简洁性,请使用一对一头;当准确率是首要优先级时,请使用一对多头。
YOLOE-26:开放词汇实例分割
YOLOE-26 将高性能的 YOLO26 架构与 YOLOE 系列的开放词汇能力相结合。它支持使用 文本提示、视觉提示 或 无提示模式 进行零样本推理,实现对任意对象类别的实时检测和分割,有效消除了固定类别训练的限制。
通过利用 YOLO26 的 无 NMS、端到端设计,YOLOE-26 提供了快速的开放世界推理。这使其成为动态环境中边缘应用的强大解决方案,这些环境中的目标对象代表了广泛且不断演变的词汇。
查看 YOLOE 文档 以获取这些在 Objects365v1、GQA 和 Flickr30k 数据集上训练的模型的使用示例。
| 模型 | 尺寸 (像素) | 提示类型 | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | 文本/视觉 | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | 文本/视觉 | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | 文本/视觉 | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | 文本/视觉 | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | 文本/视觉 | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
使用示例
YOLOE-26 支持文本和视觉提示。使用提示很简单——只需按如下所示通过 predict 方法传入即可:
通过文本提示,你可以通过文字描述来指定希望检测的类别。以下代码展示了如何使用 YOLOE-26 检测图像中的人和公交车:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()要深入了解提示技术、从零开始训练以及获取完整的使用示例,请访问 YOLOE 文档。
引用与致谢
如果你在工作中使用 YOLO26 或其他 Ultralytics 软件,请按如下方式引用它:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2026},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}DOI 待定。YOLO26 可在 AGPL-3.0 和 Enterprise 许可下使用。
常见问题
与 YOLO11 相比,YOLO26 有哪些关键改进?
- 移除 DFL:简化了导出并扩展了边缘设备的兼容性
- 端到端无 NMS 推理:消除了 NMS,使部署更快、更简单
- ProgLoss + STAL:提升了准确率,特别是针对小目标
- MuSGD 优化器:结合了 SGD 和 Muon(受 Moonshot 的 Kimi K2 启发),使训练更稳定、更高效
- CPU 推理速度提升高达 43%:为仅使用 CPU 的设备带来显著性能提升
YOLO26 支持哪些任务?
YOLO26 是一个统一的模型家族,为多种计算机视觉任务提供端到端支持:
每种尺寸变体(n、s、m、l、x)均支持所有任务,此外还通过 YOLOE-26 提供开放词汇版本。
为什么 YOLO26 针对边缘部署进行了优化?
YOLO26 通过以下特性提供顶尖的边缘计算性能:
- CPU 推理速度提升高达 43%
- 减小模型大小和内存占用
- 架构简化以提高兼容性(无 DFL,无 NMS)
- 灵活的导出格式,包括 TensorRT、ONNX、CoreML、TFLite 和 OpenVINO
我该如何开始使用 YOLO26?
YOLO26 模型于 2026 年 1 月 14 日发布,现可供下载。请安装或更新 ultralytics 包并加载模型:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")有关训练、验证和导出的说明,请参阅 使用示例 部分。