Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLO26#

计算机视觉的演进一直是由对更快、更准确、更易用模型的持续追求所定义的。在比较 Ultralytics YOLOv5 与尖端的 Ultralytics YOLO26 时,我们看到的是一种范式转移,它连接了稳健的传统系统与现代 AI 部署的最前沿。

本指南提供了这两种架构的全面技术细分,重点介绍了它们的性能指标、结构差异以及理想的部署场景。

Link to this section模型概述#

Link to this sectionYOLOv5:行业主力#

YOLOv5 于 2020 年发布,彻底改变了目标检测的易用性。通过将架构原生迁移至 PyTorch 框架,它为开发者提供了前所未有的“从零到精通”的体验。

YOLOv5 为维护良好的 Ultralytics 生态系统奠定了基础。它引入了激进的数据增强技术、高效的训练循环以及针对 CoreMLONNX 等边缘格式的高度优化导出路径。其易用性以及训练期间的低内存要求,使其成为全球创业公司和研究人员的首选。

了解更多关于 YOLOv5 的信息

Link to this sectionYOLO26:下一代视觉 AI 标准#

快进到 2026 年 1 月,Ultralytics YOLO26 代表了实时视觉 AI 的巅峰。它原生整合了 YOLOv8YOLO11 等代际更迭所获得的经验,同时引入了受大语言模型 (LLM) 训练启发的重大突破。

YOLO26 为性能平衡树立了新的基准,在提供顶尖精度的同时,经过专门设计以主导边缘计算场景。

了解更多关于 YOLO26 的信息

其他 Ultralytics 模型

如果你正在迁移旧的代码库,你可能还会对比较 YOLOv5 与 YOLO11 感兴趣,这是前一代模型,它引入了对姿态估计和旋转边界框 (OBB) 等多样化任务的初步支持。

Link to this sectionYOLO26 的架构突破#

虽然 YOLOv5 依赖于基于锚点的检测头和标准损失函数,但 YOLO26 对内部机制进行了全面彻底的改革,消除了部署瓶颈。

  1. 端到端无 NMS 设计: 最显著的区别是 YOLO26 的原生端到端架构。与需要手动进行非极大值抑制 (NMS) 来过滤冗余边界框的 YOLOv5 不同,YOLO26 完全消除了这一后处理步骤。这确保了确定性的推理延迟,并大大简化了集成到 C++ 或嵌入式硬件中的过程。
  2. 移除 DFL: YOLO26 移除了分布焦点损失 (DFL)。这一架构选择极大地简化了模型导出,并增强了与低功耗边缘设备和微控制器的兼容性,这些设备通常难以处理复杂的算子。
  3. MuSGD 优化器: 借鉴了 Moonshot AI 的 Kimi K2,YOLO26 使用了 MuSGD 优化器,这是 SGD 和 Muon 的混合体。它将 LLM 训练中的稳定性和快速收敛性带到了计算机视觉领域,与重型 Transformer 模型相比,内存占用更低,训练周期更快。
  4. ProgLoss + STAL: YOLO26 利用了先进的 ProgLoss 和 STAL 函数,极大地提高了其检测小目标和密集目标的能力——这曾是 YOLOv5 的一个历史性挑战。

Link to this section性能比较#

当在 COCO 数据集 上比较这些模型时,YOLO26 在精度 (mAP) 方面展现出了巨大的提升,同时降低了参数量和 CPU 推理速度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

注:YOLO26 Nano (YOLO26n) 达到了惊人的 40.9 mAP,而 YOLOv5n 为 28.0 mAP;得益于 DFL 的移除和无 NMS 头部,其 CPU 推理速度最高可提升 43%

Link to this section多功能性与任务支持#

YOLOv5 主要以 目标检测 而闻名。虽然后续更新引入了基础的分割功能,但 YOLO26 从一开始就是作为一个统一的多任务引擎构建的。

YOLO26 原生支持:

  • 实例分割: 具备任务特定的多尺度原型和语义分割损失。
  • 姿态估计: 利用残差对数似然估计 (RLE) 进行高精度的关键点检测。
  • 旋转边界框 (OBB): 包含专门的角度损失以解决边界不连续问题,这对 卫星图像分析 至关重要。
  • 图像分类: 标准的全图分类。
生态系统集成

这两个模型都受益于 Ultralytics Platform,提供了无缝的数据标注、自动化超参数调优和一键云端部署。然而,YOLO26 充分利用了现代 API 结构。

Link to this section使用和代码示例#

Ultralytics Python API 让模型之间的切换变得极其简单。由于两个模型共享同一个维护良好的生态系统,将传统的 YOLOv5 流水线升级到 YOLO26 只需更改权重文件即可。

Link to this sectionPython 示例#

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionCLI 示例#

你可以使用 TensorRT 集成通过命令行直接部署 YOLO26,以获得最大的 GPU 吞吐量:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Link to this section理想使用场景#

Link to this section何时选择 YOLO26#

对于任何现代计算机视觉项目,YOLO26 是毋庸置疑的推荐

  • 边缘 AI 和物联网: 其 CPU 推理速度提升了 43%,且移除了 DFL,这使其非常适合部署在 Raspberry Pi 或移动设备上。
  • 高速流水线: 无 NMS 架构确保了稳定、可预测的延迟,这对于自动驾驶机器人和实时 安全报警系统 至关重要。
  • 复杂场景: 如果你的应用需要跟踪小目标(例如 无人机监控)或旋转目标 (OBB),YOLO26 的高级损失函数 (ProgLoss + STAL) 提供了巨大的精度优势。

Link to this section何时选择 YOLOv5#

  • 传统系统: 如果你的生产环境在 YOLOv5 特定的锚点生成或 NMS 解析逻辑上有硬编码依赖,迁移可能需要一段简短的重构期。
  • 特定的学术基准: 研究人员经常使用 YOLOv5 作为经典基准,以展示 目标检测架构 的历史进展。

Link to this section总结#

从 YOLOv5 到 YOLO26 的过渡不仅仅是一次迭代更新,这是目标检测模型训练和部署方式上的根本性飞跃。通过利用 MuSGD 优化器、通过无 NMS 设计放弃复杂的后处理,以及大幅提升 CPU 速度,Ultralytics YOLO26 在速度和精度之间提供了无妥协的平衡。

虽然 YOLOv5 将永远作为让视觉 AI 普及化的模型被人们铭记,但希望构建稳健、可投入生产且面向未来应用的开发者,应充满信心地在 YOLO26 的基础上进行构建。

评论