Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 与 YOLO11:视觉 AI 的代际飞跃#

在构建最前沿的计算机视觉系统时,选择合适的模型对于平衡准确性、延迟和资源效率至关重要。在人工智能快速发展的背景下,Ultralytics 持续突破能力的极限。这份详尽的技术对比探讨了从大获成功的 YOLO11 到革命性的新一代 YOLO26 的转变,旨在为 AI 工程师和研究人员提供做出明智架构决策所需的见解。

Link to this section模型谱系与元数据#

这两个模型均由 Ultralytics 开发,但它们代表了目标检测和多任务视觉模型演进时间线上的不同范式。

YOLO26 详情:

了解关于 YOLO26 的更多信息

YOLO11 详情:

了解关于 YOLO11 的更多信息

其他架构

虽然 YOLO26 是我们最先进的实时模型,但处理高度专业化硬件或海量内存容量的用户也可以探索基于 Transformer 的架构,例如 RT-DETR 或突破性的无 NMS 先驱 YOLOv10

Link to this section架构差异与创新#

从 YOLO11 到 YOLO26 的跨越涉及模型架构和底层训练方案的根本性转变。虽然 YOLO11 为目标检测和多任务学习建立了稳固的基准,但 YOLO26 对边缘计算的部署流程进行了全面彻底的革新。

Link to this section端到端无 NMS 设计#

YOLO26 最重要的升级之一是其原生的端到端架构。与依赖 非极大值抑制 (NMS) 后处理来过滤重叠边界框的 YOLO11 不同,YOLO26 完全消除了这一步骤。这一概念最早在 YOLOv10 中被首创,它显著降低了延迟的波动,并简化了跨各类边缘设备的部署逻辑。

Link to this section移除 DFL 以提升边缘效率#

YOLO11 利用分布式焦点损失 (DFL) 来优化边界框估算。然而,DFL 依赖于复杂的 softmax 操作,而这些操作通常在低功耗边缘加速器上的支持不佳。YOLO26 在不牺牲准确性的前提下成功移除了 DFL。这种架构简化显著提升了与嵌入式系统的兼容性,并使 YOLO26 相比前代产品实现了最高 43% 的 CPU 推理速度提升

Link to this sectionMuSGD 优化器#

训练的稳定性和速度至关重要。YOLO26 引入了 MuSGD 优化器,这是随机梯度下降 (SGD) 和 Muon 的结合体,深受 Moonshot AI Kimi K2 的大模型训练创新启发。该优化器将语言模型训练的稳定性带入了计算机视觉领域,确保了更快的收敛速度,并相较于沉重的 Transformer 替代方案减少了训练期间的内存占用。

Link to this sectionProgLoss 与 STAL#

对于从事航空影像或无人机应用的研究人员来说,检测微小特征是一个历史性挑战。YOLO26 引入了 ProgLoss 并结合了 STAL(尺度目标注意力损失),在小目标识别方面比 YOLO11 带来了显著的提升。

Link to this section性能与指标对比#

当进行模型正面对比时,YOLO26 在精度和边缘设备效率方面展现出了明显的优越性,同时保持了 Ultralytics 生态系统所特有的超低内存需求。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注:YOLO26 nano (YOLO26n) 模型相较于 YOLO11n 在 CPU 速度上提升了约 31%(38.9ms 对比 56.1ms),凸显了其“边缘优先”的设计理念。

Link to this section跨计算机视觉任务的通用性#

这两个模型都受益于维护良好的 Ultralytics 生态系统,通过统一的 Python API 提供了无与伦比的使用便捷性。它们不仅是目标检测器,更是多任务处理的引擎。不过,YOLO26 结合了多项针对特定任务的改进:

  • 实例分割: YOLO26 使用了改进的语义分割损失和多尺度原型,生成了比 YOLO11 更清晰的掩码边界。了解关于分割工作流的更多信息。
  • 姿态估计: 通过集成残差对数似然估计 (RLE),YOLO26 显著提升了复杂人体姿态下的关键点准确性。探索姿态估计功能
  • 旋转目标检测 (OBB): 专门的角度损失函数解决了历史性的边界不连续问题,使得 YOLO26 在检测卫星图像中的旋转目标时异常可靠。阅读关于OBB 任务的内容。
  • 图像分类: 这两个模型都能高效处理高速分类任务,其中 YOLO26 在 ImageNet 上的 top-1 准确率有小幅提升。

Link to this section训练与推理代码示例#

Ultralytics 因其开发者体验而备受推崇。训练一个最先进模型或运行推理脚本仅需几行代码,从而最大限度地减少了样板代码并提高了生产力。此外,训练 YOLO 模型所需的 CUDA 内存远低于大型 Transformer 网络。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this section理想用例与部署策略#

在 YOLO26 和 YOLO11 之间做出选择,完全取决于你生产环境的限制条件。

Link to this section何时部署 YOLO26#

对于现代新建项目,YOLO26 是明确的首选。它是专为以下场景构建的:

  • 边缘计算与 IoT: 其惊人的 CPU 性能和 DFL 移除特性使其成为 Raspberry Pi、Coral TPU 和移动处理器等设备的王者。
  • 无人机与空中分析: ProgLoss + STAL 的集成使其在跨广阔景观跟踪微小、快速移动的目标方面表现独特。
  • Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.

Link to this section何时保留 YOLO11#

虽然 YOLO26 更为优越,但 YOLO11 依然是一个能力极强的模型。如果遇到以下情况,你可能需要坚持使用 YOLO11:

  • 遗留管道: 你现有的 C++ 部署基础设施与旧架构中特定的基于锚点的输出和 NMS 逻辑紧密耦合。
  • 学术基准: 你正在发表研究成果,需要一个广受认可的 2024 标准来对比你的新算法。

Link to this sectionUltralytics 生态系统的力量#

无论你部署的是 YOLO11 还是 YOLO26,使用 Ultralytics 模型意味着接入了一个维护良好的生态系统,并享受频繁的更新和广泛的社区支持。

对于企业团队,Ultralytics 平台 提供了从数据标注、模型训练到无缝云端部署的端到端解决方案。从将训练好的权重导出至 CoreMLTensorRT,到配置高级超参数调优,所提供的工具确保了你的 AI 生命周期尽可能精简高效。

评论