Ultralytics YOLO26

Q: What tasks does YOLO26 support?

YOLO26 是一个统一的模型家族，为多种计算机视觉任务提供端到端支持：每个尺寸变体（n、s、m、l、x）都支持所有任务，并通过 YOLOE-26 提供开放词汇版本。

Q: Why is YOLO26 optimized for edge deployment?

YOLO26 提供了最先进的边缘性能，具有以下特点：

Q: How do I get started with YOLO26?

YOLO26 模型于 2026 年 1 月 14 日发布，可供下载。安装或更新 ultralytics 包并加载模型：有关训练、验证和导出说明，请参阅“使用示例”部分。

概述

Ultralytics YOLO26 是 YOLO 系列实时对象检测器的最新演进，从头开始专为边缘和低功耗设备而设计。它引入了简化的设计，消除了不必要的复杂性，同时集成了有针对性的创新，以实现更快、更轻、更易于访问的部署。

Ultralytics YOLO26 比较图

试用UltralyticsUltralytics

在Ultralytics 直接探索并运行YOLO26模型。

YOLO26 的架构遵循三个核心原则：

简洁性: YOLO26是一个原生的端到端模型，直接生成预测结果，无需非极大值抑制（NMS）。通过消除这一后处理步骤，推理变得更快、更轻量，并且更容易部署到实际系统中。这种突破性方法最初由清华大学的王傲在YOLOv10中开创，并在YOLO26中得到了进一步发展。
部署效率： 端到端设计消除了管道的整个阶段，从而大大简化了集成，减少了延迟，并使部署在各种环境中更加稳健。
训练创新：YOLO26 引入了MuSGD 优化器，它是 SGD 和 Muon 的混合体——灵感来源于 Moonshot AI 在 LLM 训练中 Kimi K2 的突破。该优化器带来了增强的稳定性和更快的收敛，将语言模型中的优化进展转移到计算机视觉领域。
任务特定优化：YOLO26 针对专业任务引入了有针对性的改进，包括用于 Segmentation 的语义分割损失和多尺度原型模块，用于高精度 姿势估计 的残差对数似然估计 (RLE)，以及通过角度损失优化解码以解决 旋转框检测 中的边界问题。

这些创新共同提供了一个模型系列，该模型系列在小对象上实现了更高的精度，提供了无缝部署，并且在 CPU 上的运行速度提高了 43% — 使 YOLO26 成为迄今为止资源受限环境中最实用和可部署的 YOLO 模型之一。

主要功能

DFL 移除
分布式焦点损失（DFL）模块虽然有效，但常常使导出复杂化并限制了硬件兼容性。YOLO26 完全移除了 DFL，简化了推理过程，并拓宽了对边缘和低功耗设备的支持。
端到端无NMS推理
与依赖NMS作为独立后处理步骤的传统检测器不同，YOLO26是原生端到端的。预测结果直接生成，减少了延迟，并使集成到生产系统更快、更轻量、更可靠。
ProgLoss + STAL
改进的损失函数提高了检测精度，在小目标识别方面有显著改进，这是物联网、机器人、航空影像和其他边缘应用的关键要求。
MuSGD Optimizer
一种新型混合优化器，结合了SGD和Muon。灵感来自 Moonshot AI 的Kimi K2，MuSGD 将 LLM 训练中的先进优化方法引入计算机视觉，从而实现更稳定的训练和更快的收敛。
CPU推理速度提升高达43%
YOLO26专为边缘计算优化，提供显著更快的CPU推理，确保在没有GPU的设备上实现实时性能。
实例分割增强
引入语义分割损失以改善模型收敛，以及升级的原型模块，该模块利用多尺度信息以获得卓越的掩膜质量。
精确姿势估计
集成残差对数似然估计 (RLE)，以实现更精确的关键点定位，并优化解码过程以提高推理速度。
优化旋转框检测解码
引入专门的角度损失以提高方形物体的检测精度，并优化旋转框检测解码以解决边界不连续性问题。

Ultralytics YOLO26 端到端对比图

支持的任务和模式

YOLO26 基于早期 Ultralytics YOLO 版本建立的多功能模型系列，为各种计算机视觉任务提供增强支持：

模型	文件名	任务	推理	验证	训练	导出
YOLO26	`yolo26n.pt` `yolo26s.pt` `yolo26m.pt` `yolo26l.pt` `yolo26x.pt`	检测	✅	✅	✅	✅
YOLO26-seg	`yolo26n-seg.pt` `yolo26s-seg.pt` `yolo26m-seg.pt` `yolo26l-seg.pt` `yolo26x-seg.pt`	实例分割	✅	✅	✅	✅
YOLO26-姿势估计	`yolo26n-pose.pt` `yolo26s-pose.pt` `yolo26m-pose.pt` `yolo26l-pose.pt` `yolo26x-pose.pt`	姿势/关键点	✅	✅	✅	✅
YOLO26-obb	`yolo26n-obb.pt` `yolo26s-obb.pt` `yolo26m-obb.pt` `yolo26l-obb.pt` `yolo26x-obb.pt`	定向检测	✅	✅	✅	✅
YOLO26-cls	`yolo26n-cls.pt` `yolo26s-cls.pt` `yolo26m-cls.pt` `yolo26l-cls.pt` `yolo26x-cls.pt`	分类	✅	✅	✅	✅

这种统一的框架确保 YOLO26 适用于实时检测、分割、分类、姿势估计和定向对象检测，所有这些都支持训练、验证、推理和导出。

性能指标

性能

检测 (COCO)分割 (COCO)分类 (ImageNet)姿势估计 (COCO)旋转框检测 (DOTAv1)

请参阅detect 文档，以获取这些在COCO上训练的模型的使用示例，其中包括80个预训练类别。

模型	尺寸 ^(像素)	mAP^val 50-95	mAP^{val 50-95(e2e)}	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	40.1	38.9 ± 0.7	1.7 ± 0.0	2.4	5.4
YOLO26s	640	48.6	47.8	87.2 ± 0.9	2.5 ± 0.0	9.5	20.7
YOLO26m	640	53.1	52.5	220.0 ± 1.4	4.7 ± 0.1	20.4	68.2
YOLO26l	640	55.0	54.4	286.2 ± 2.0	6.2 ± 0.2	24.8	86.4
YOLO26x	640	57.5	56.9	525.8 ± 4.0	11.8 ± 0.2	55.7	193.9

请参阅segment 文档，以获取这些在COCO上训练的模型的使用示例，其中包括80个预训练类别。

模型	尺寸 ^(像素)	mAP^{box 50-95(e2e)}	mAP^{mask 50-95(e2e)}	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^(B)
YOLO26n-seg	640	39.6	33.9	53.3 ± 0.5	2.1 ± 0.0	2.7	9.1
YOLO26s-seg	640	47.3	40.0	118.4 ± 0.9	3.3 ± 0.0	10.4	34.2
YOLO26m-seg	640	52.5	44.1	328.2 ± 2.4	6.7 ± 0.1	23.6	121.5
YOLO26l-seg	640	54.4	45.5	387.0 ± 3.7	8.0 ± 0.1	28.0	139.8
YOLO26x-seg	640	56.5	47.0	787.0 ± 6.8	16.4 ± 0.1	62.8	313.5

请参阅分类文档，以获取这些在ImageNet上训练的模型的使用示例，其中包括1000个预训练类别。

模型	尺寸 ^(像素)	acc ^top1	acc ^top5	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^{(B) at 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

请参阅姿势估计文档，以获取这些在COCO上训练的模型的使用示例，其中包括1个预训练类别，“person”。

模型	尺寸 ^(像素)	mAP^{姿势估计 50-95(e2e)}	mAP^{姿势估计 50(e2e)}	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^(B)
YOLO26n-姿势估计	640	57.2	83.3	40.3 ± 0.5	1.8 ± 0.0	2.9	7.5
YOLO26s-姿势估计	640	63.0	86.6	85.3 ± 0.9	2.7 ± 0.0	10.4	23.9
YOLO26m-姿势估计	640	68.8	89.6	218.0 ± 1.5	5.0 ± 0.1	21.5	73.1
YOLO26l-姿势估计	640	70.4	90.5	275.4 ± 2.4	6.5 ± 0.1	25.9	91.3
YOLO26x-姿势估计	640	71.6	91.6	565.4 ± 3.0	12.2 ± 0.2	57.6	201.7

请参阅定向 detect 文档，以获取这些在DOTAv1上训练的模型的使用示例，其中包括15个预训练类别。

模型	尺寸 ^(像素)	mAP^{test 50-95(e2e)}	mAP^test 50(e2e)	速度 ^{CPU ONNX (毫秒)}	速度 ^{T4 TensorRT10 (毫秒)}	参数 ^(M)	FLOPs ^(B)
YOLO26n-obb	1024	52.4	78.9	97.7 ± 0.9	2.8 ± 0.0	2.5	14.0
YOLO26s-obb	1024	54.8	80.9	218.0 ± 1.4	4.9 ± 0.1	9.8	55.1
YOLO26m-obb	1024	55.3	81.0	579.2 ± 3.8	10.2 ± 0.3	21.2	183.3
YOLO26l-obb	1024	56.2	81.6	735.6 ± 3.1	13.0 ± 0.2	25.6	230.0
YOLO26x-obb	1024	56.7	81.7	1485.7 ± 11.5	30.5 ± 0.9	57.6	516.5

参数和浮点运算次数值适用于融合后的模型 model.fuse()该模型合并了Conv层与BatchNorm层，并移除了辅助的一对多检测头。预训练检查点保留了完整的训练架构，可能呈现更高的计数值。

使用示例

本节提供简单的YOLO26训练和推理示例。有关这些及其他模式的完整文档，请参阅预测、训练、验证和导出文档页面。

请注意，以下示例适用于YOLO26 Detect模型，用于目标检测。有关其他支持的任务，请参阅Segment、Classify、旋转框检测和姿势估计文档。

示例

PythonCLI

PyTorch pretrained *.pt 模型以及配置 *.yaml 文件可以传递给 YOLO() 类在 Python 中创建模型实例：

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

可以使用 CLI 命令直接运行模型：

# Load a COCO-pretrained YOLO26n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo26n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO26n model and run inference on the 'bus.jpg' image
yolo predict model=yolo26n.pt source=path/to/bus.jpg

双头架构

YOLO26采用双头架构，为不同部署场景提供灵活性：

一对一头（默认）生成端到端预测结果，不NMS（非最大似然）处理，输出 (N, 300, 6) 每张图像最多可检测300个目标。该检测头经过优化，可实现快速推理和简化部署。
一对多头生成需要NMS 传统YOLO ，输出 (N, nc + 4, 8400) 其中 nc 是类别数量。这种头部通常以额外处理为代价，能实现略高的准确率。

您可以在导出、预测或验证过程中切换预测头：

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export

# Use one-to-one head (default, no NMS required)
yolo predict model=yolo26n.pt source=image.jpg
yolo val model=yolo26n.pt data=coco.yaml
yolo export model=yolo26n.pt format=onnx

# Use one-to-many head (requires NMS)
yolo predict model=yolo26n.pt source=image.jpg end2end=False
yolo val model=yolo26n.pt data=coco.yaml end2end=False
yolo export model=yolo26n.pt format=onnx end2end=False

选择取决于您的部署需求：若追求最高速度和简便性，请选用一对一处理器；若精度是首要考量，则应选用多对一处理器。

YOLOE-26：开放词汇实例分割

YOLOE-26将高性能YOLO26架构与YOLOE系列的开放词汇能力相结合。它通过使用文本提示、视觉提示或无提示模式进行零样本推理，实现对任何目标类别的实时检测和分割，有效消除了固定类别训练的限制。

通过利用YOLO26的免NMS、端到端设计，YOLOE-26提供了快速的开放世界推理。这使其成为动态环境中边缘应用的强大解决方案，其中感兴趣的目标代表着广泛且不断演进的词汇。

性能

文本/视觉提示无提示

请参阅YOLOE文档，了解这些模型在Objects365v1、GQA和Flickr30k数据集上训练的使用示例。

模型	尺寸 ^(像素)	提示类型	mAP^{minival 50-95(e2e)}	mAP^{minival 50-95}	mAP_r	mAP_c	mAP_f	参数 ^(M)	FLOPs ^(B)
YOLOE-26n-seg	640	文本/视觉	23.7 / 20.9	24.7 / 21.9	20.5 / 17.6	24.1 / 22.3	26.1 / 22.4	4.8	6.0
YOLOE-26s-seg	640	文本/视觉	29.9 / 27.1	30.8 / 28.6	23.9 / 25.1	29.6 / 27.8	33.0 / 29.9	13.1	21.7
YOLOE-26m-seg	640	文本/视觉	35.4 / 31.3	35.4 / 33.9	31.1 / 33.4	34.7 / 34.0	36.9 / 33.8	27.9	70.1
YOLOE-26l-seg	640	文本/视觉	36.8 / 33.7	37.8 / 36.3	35.1 / 37.6	37.6 / 36.2	38.5 / 36.1	32.3	88.3
YOLOE-26x-seg	640	文本/视觉	39.5 / 36.2	40.6 / 38.5	37.4 / 35.3	40.9 / 38.8	41.0 / 38.8	69.9	196.7

请参阅YOLOE文档，了解这些模型在Objects365v1、GQA和Flickr30k数据集上训练的使用示例。

模型	尺寸 ^(像素)	mAP^{minival 50-95(e2e)}	mAP^{minival 50(e2e)}	参数 ^(M)	FLOPs ^(B)
YOLOE-26n-seg-pf	640	16.6	22.7	6.5	15.8
YOLOE-26s-seg-pf	640	21.4	28.6	16.2	35.5
YOLOE-26m-seg-pf	640	25.7	33.6	36.2	122.1
YOLOE-26l-seg-pf	640	27.2	35.4	40.6	140.4
YOLOE-26x-seg-pf	640	29.9	38.7	86.3	314.4

使用示例

YOLOE-26 支持基于文本和基于视觉的提示。使用提示非常简单——只需通过 predict 方法，如下所示：

示例

文本提示视觉提示无提示词

文本提示允许您通过文本描述指定要 detect 的类别。以下代码展示了如何使用 YOLOE-26 来 detect 图像中的人物和公交车：

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

通过展示目标类别的视觉示例（而不是用文字描述），视觉提示允许您引导模型。

import numpy as np

from ultralytics import YOLO
from ultralytics.models.yolo.yoloe import YOLOEVPSegPredictor

# Initialize model
model = YOLO("yoloe-26l-seg.pt")

# Define visual prompts using bounding boxes and their corresponding class IDs.
# Each box highlights an example of the object you want the model to detect.
visual_prompts = dict(
    bboxes=np.array(
        [
            [221.52, 405.8, 344.98, 857.54],  # Box enclosing person
            [120, 425, 160, 445],  # Box enclosing glasses
        ],
    ),
    cls=np.array(
        [
            0,  # ID to be assigned for person
            1,  # ID to be assigned for glasses
        ]
    ),
)

# Run inference on an image, using the provided visual prompts as guidance
results = model.predict(
    "ultralytics/assets/bus.jpg",
    visual_prompts=visual_prompts,
    predictor=YOLOEVPSegPredictor,
)

# Show results
results[0].show()

YOLOE-26 包含免提示变体，这些变体自带内置词汇表。这些模型不需要任何提示，并且像传统的 YOLO 模型一样工作。它们不依赖用户提供的标签或视觉示例，而是根据 Recognize Anything Model Plus (RAM++) 使用的标签集，从 4,585 个预定义类别列表中 detect 对象。

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg-pf.pt")

# Run prediction. No prompts required.
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

要深入了解提示技术、从头开始训练以及完整的用法示例，请访问 YOLOE 文档。

引用和致谢

Ultralytics YOLO26 发布

由于模型快速发展的特性，Ultralytics 尚未发布 YOLO26 的正式研究论文。相反，我们专注于提供最先进的模型并使其易于使用。有关 YOLO 功能、架构和用法的最新更新，请访问我们的 GitHub 存储库和文档。

如果您在工作中使用 YOLO26 或其他 Ultralytics 软件，请引用它：

BibTeX

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI 待定。YOLO26 在 AGPL-3.0 和 Enterprise 许可下可用。

常见问题

与 YOLO11 相比，YOLO26 的主要改进是什么？

DFL 移除：简化导出并扩展边缘兼容性
端到端无NMS推理: 消除NMS，实现更快、更简单的部署
ProgLoss + STAL：提高准确性，尤其是在小物体上
MuSGD Optimizer：结合 SGD 和 Muon（灵感来自 Moonshot 的 Kimi K2），实现更稳定、高效的训练
CPU 推理速度提高高达 43%：CPU 设备的主要性能提升

YOLO26 支持哪些任务？

YOLO26 是一个统一的模型系列，为多种计算机视觉任务提供端到端支持：

每个尺寸变体（n、s、m、l、x）都支持所有任务，并通过 YOLOE-26 支持开放词汇版本。

为什么 YOLO26 针对边缘部署进行了优化？

YOLO26 提供 最先进的边缘性能，具有：

CPU 推理速度提高高达 43%
减小的模型尺寸和内存占用
为兼容性简化的架构（无 DFL，无 NMS）
灵活的导出格式，包括 TensorRT、ONNX、CoreML、TFLite 和 OpenVINO

如何开始使用 YOLO26？

YOLO26 模型于 2026 年 1 月 14 日发布，可供下载。安装或更新 ultralytics 包并加载模型：

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")