Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 与 YOLO26#

计算机视觉的飞速发展不断突破速度、精度和部署效率的极限。在实时目标检测领域,Ultralytics 始终设定着行业标准。本技术对比深入探讨了从广受成功的 YOLO11 到前沿的 YOLO26 的演进,分析了它们的架构、性能指标及理想部署场景。

无论你是在构建 无人机配送系统 还是优化全球 智能制造流水线,了解这两款模型之间的细微差异都将助你打造稳健且面向未来的 AI 解决方案。

Link to this section模型传承与生态系统#

两款模型均受益于综合性的 Ultralytics 生态系统,该生态以简洁的 API、持续维护和充满活力的社区为特色。它们提供了无与伦比的多功能性,原生支持 目标检测实例分割图像分类姿态估计 以及 旋转目标检测 (OBB) 任务。

Link to this sectionYOLO11:久经考验的标准#

YOLO11 发布于 2024 年末,完善了早期版本的先进成果,巩固了其作为生产环境中可靠主力的地位。

了解更多关于 YOLO11 的信息

Link to this sectionYOLO26:全新前沿#

YOLO26 于 2026 年初推出,代表了边缘计算和端到端架构的范式转移,在处理速度和集成便捷性方面带来了显著提升。

了解更多关于 YOLO26 的信息

数据与部署管理

YOLO11 和 YOLO26 均与 Ultralytics Platform 完全集成,为数据集标注、云端训练和车队监控提供了流畅的无代码工作流。

Link to this section架构创新#

虽然 YOLO11 依赖于多年来驱动计算机视觉的传统后处理方法,但 YOLO26 引入了多项旨在消除瓶颈的结构性突破。

Link to this section端到端无 NMS 设计#

YOLO26 最重要的升级之一是其原生端到端架构。它消除了非极大值抑制 (NMS) 后处理,这一概念最早由 YOLOv10 提出。绕过 NMS 大大简化了部署管道,并确保了稳定的延迟,这对 自动驾驶算法 等实时应用至关重要。

Link to this section移除 DFL 以优化边缘端#

YOLO26 移除了分布焦点损失 (DFL)。虽然 DFL 在 YOLO11 中对细粒度定位非常有用,但将其移除可简化网络的导出图。这一改动确保了与低功耗硬件的更强兼容性,使 YOLO26 成为 Raspberry PiNVIDIA Jetson 等边缘设备上的绝对性能利器。

Link to this sectionMuSGD 优化器#

借鉴大语言模型 (LLM) 的训练机制,特别是 Moonshot AI 的 Kimi K2,YOLO26 采用了革命性的 MuSGD 优化器。这种随机梯度下降 (SGD) 与 Muon 的混合体提供了非常稳定的训练过程,收敛速度远超老架构中使用的标准 AdamW 优化器。

Link to this section高级损失函数#

YOLO26 集成了 ProgLoss + STAL(渐进式损失与尺度感知任务对齐学习)。这种组合极大地提高了对微小和密集物体的检测能力。此外,YOLO26 引入了任务特定的增强功能:用于语义分割的专用多尺度原型、用于复杂人体姿态估计的残差对数似然估计 (RLE),以及用于缓解 OBB 检测任务中边界问题的专门角度损失。

Link to this section性能比较#

When evaluating these models, the balance between parameter count, computational complexity (FLOPs), and speed dictates hardware selection. YOLO26 specifically targets CPU inference speed, achieving up to 43% faster CPU inference compared to its predecessor.

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

如实验所示,YOLO26 Nano (YOLO26n) 在精度上实现了显著飞跃,并使用 ONNX Runtime 将 CPU 推理时间从 56.1ms 缩短至 38.9ms。

为极致速度而导出

为了挖掘这些模型的全部性能,建议在 NVIDIA 硬件上使用 TensorRT 或为 Intel CPU 使用 OpenVINO 进行导出。YOLO26 的无 NMS 设计使这一导出过程比以往任何时候都更加顺畅。

Link to this section使用案例与实际应用#

在 YOLO11 和 YOLO26 之间进行选择,很大程度上取决于你的特定基础设施和项目目标。

Link to this section边缘计算与物联网#

对于受功耗和硬件限制的应用(如通过无人机进行的智慧农业监测或本地 安防报警系统),YOLO26 是无可争议的冠军。DFL 的移除和 43% 的 CPU 速度提升意味着你无需专用 GPU 即可在设备上运行复杂的视觉模型,同时保持高帧率。

Link to this section云端与企业规模#

YOLO11 仍然是企业解决方案的卓越之选,因为其庞大的服务器集群已经针对其张量结构进行了优化。它非常适合 基于云的视频分析 和已经与其特定输出格式深度集成的大规模媒体处理流水线。

Link to this section复杂的多任务处理#

如果你的项目要求对微小物体实现精确检测(例如检测电路板缺陷或追踪 航空影像 中的远距离车辆),YOLO26 中实现的 ProgLoss + STAL 为这些困难的边缘案例提供了显著的召回率和精度提升。

Link to this section训练效率和内存需求#

Ultralytics 框架的一大主要优势是其在训练期间极低的内存占用。与 RT-DETR 等庞大的视觉 Transformer 或较旧的 YOLOv8 不同,后者可能会消耗大量 CUDA 内存,而 YOLO11 和 YOLO26 都经过优化,可在消费级硬件上高效训练。

YOLO26 中 MuSGD 优化器的集成进一步增强了这一点,确保模型更快地找到最优权重,减少了总体的 GPU 计算小时数和 云计算成本

这是一个简单的示例,展示了使用原生 Python API 训练最新的 YOLO26 模型有多么轻松:

from ultralytics import YOLO

# Initialize the YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run a quick validation to verify the mAP metrics
metrics = model.val()

# Export the trained model to ONNX for fast CPU inference
model.export(format="onnx")

Link to this section探索替代架构#

虽然 YOLO26 代表了实时检测的巅峰,但探索 Ultralytics 文档中的其他模型也同样有益。对于受限于旧环境的用户,YOLOv5 等早期架构仍能提供稳健的性能。对于无法预先定义类别的零样本能力需求,YOLO-World 提供了由文本提示驱动的开放词汇检测。

Link to this section结论#

从 YOLO11 到 YOLO26 的飞跃不仅仅是一次增量更新,而是对实时目标检测模型在生产环境中运行方式的结构性重构。通过放弃复杂的后处理步骤并针对边缘执行进行优化,YOLO26 作为现代开发者的首选脱颖而出。在强大的 Ultralytics 生态系统 和详尽文档的支持下,升级到 YOLO26 可确保为几乎所有计算机视觉任务实现更快的部署、稳定的训练和 SOTA 精度。

评论