YOLOv5 对比 YOLO26:实时目标检测的代际飞跃

计算机视觉的发展历程始终由对更快速、更准确和更易用模型的不断追求所定义。当我们将 Ultralytics YOLOv5 与尖端的 Ultralytics YOLO26 进行对比时,我们所见证的是一种范式转移,它填补了稳健的传统系统与现代 AI 部署最前沿之间的鸿沟。

本指南提供了两种架构的全面技术解析,重点介绍了它们的性能指标、结构差异以及理想的部署场景。

模型概览

YOLOv5:行业的中流砥柱

YOLOv5 发布于 2020 年,彻底改变了目标检测的易用性。通过将架构原生迁移至 PyTorch 框架,它为开发者提供了前所未有的“从零到精通”的开发体验。

YOLOv5 为维护良好的 Ultralytics 生态系统奠定了基础。它引入了激进的数据增强技术、高效的训练循环以及针对 CoreMLONNX 等边缘格式高度优化的导出路径。其易用性以及在训练期间的低内存占用,使其成为全球初创公司和研究人员的首选。

了解更多关于 YOLOv5 的信息

YOLO26:下一代视觉 AI 标准

快进到 2026 年 1 月,Ultralytics YOLO26 代表了实时视觉 AI 的巅峰。它原生集成了从 YOLOv8YOLO11 等中间代次中汲取的经验,同时引入了受大语言模型 (LLM) 训练启发的重大突破。

YOLO26 树立了性能平衡的新标杆,在提供顶尖准确性的同时,其设计初衷明确旨在主导边缘计算场景。

了解关于 YOLO26 的更多信息

其他 Ultralytics 模型

如果你正在迁移旧的代码库,可能也会有兴趣对比 YOLOv5 与 YOLO11,后者是上一代模型,引入了对姿态估计和旋转边界框 (OBB) 等多样化任务的初步支持。

YOLO26 的架构突破

尽管 YOLOv5 依赖于基于锚框 (anchor-based) 的检测头和标准损失函数,但 YOLO26 对内部机制进行了彻底改造,以消除部署瓶颈。

  1. 端到端无 NMS 设计: 最显著的区别在于 YOLO26 采用了原生的端到端架构。与需要手动进行非极大值抑制 (NMS) 来过滤冗余边界框的 YOLOv5 不同,YOLO26 完全省去了此后处理步骤。这确保了确定性的推理延迟,并极大简化了集成到 C++ 或嵌入式硬件中的难度。
  2. 移除 DFL: YOLO26 移除了分布焦点损失 (DFL)。这一架构决策大幅简化了模型导出,并增强了与低功耗边缘设备和微控制器的兼容性,这些设备通常难以处理复杂的算子。
  3. MuSGD 优化器: 借鉴了月之暗面 (Moonshot AI) 的 Kimi K2,YOLO26 采用了 MuSGD 优化器,这是 SGD 和 Muon 的混合体。它将 LLM 训练中的稳定性和快速收敛性引入了计算机视觉,与大量使用 Transformer 的模型相比,实现了更低的内存占用和更快的训练周期。
  4. ProgLoss + STAL: YOLO26 使用了复杂的 ProgLoss 和 STAL 函数,极大地提高了其检测小目标和密集目标的能力——这曾是 YOLOv5 的历史性挑战。

性能对比

COCO 数据集 上对比模型时,YOLO26 在精度 (mAP) 上展现出了巨大的提升,同时减少了参数数量并提高了 CPU 推理速度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

注:YOLO26 Nano (YOLO26n) 达到了惊人的 40.9 mAP,相比之下 YOLOv5n 为 28.0 mAP,且由于移除了 DFL 和无 NMS 检测头,它还提供了高达 43% 的 CPU 推理加速

多功能性和任务支持

YOLOv5 主要以 目标检测 而闻名。虽然后续更新引入了基本的分割功能,但 YOLO26 是从零开始构建的,旨在成为一个统一的多任务引擎。

YOLO26 原生支持:

  • 实例分割: 具备任务特定的多尺度原型 (protos) 和语义分割损失。
  • 姿态估计: 利用残差对数似然估计 (RLE) 进行高精度的关键点检测。
  • 旋转边界框 (OBB): 包含专门的角度损失以解决边界不连续问题,这对 卫星图像分析 至关重要。
  • 图像分类: 标准的全图分类。
生态系统集成

这两种模型都受益于 Ultralytics 平台,提供了无缝的数据标注、自动超参数调优和一键云端部署。然而,YOLO26 充分利用了现代 API 结构。

使用方法与代码示例

Ultralytics Python API 使模型间的切换变得极其简单。由于两种模型共享同一个维护良好的生态系统,将旧的 YOLOv5 流水线更新到 YOLO26 仅需更改权重文件。

Python 示例

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

CLI 示例

你可以使用 TensorRT 集成通过命令行直接部署 YOLO26,以获得最大的 GPU 吞吐量:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

理想用例

何时选择 YOLO26

对于任何现代计算机视觉项目,YOLO26 是毫无疑问的推荐之选

  • 边缘 AI 和 IoT: 其 43% 的 CPU 推理加速和对 DFL 的移除,使其非常适合部署在 Raspberry Pi 或移动设备上。
  • 高速流水线: 无 NMS 架构确保了稳定、可预测的延迟,这对于自主机器人和实时 安防报警系统 至关重要。
  • 复杂场景: 如果你的应用需要跟踪小目标(例如 无人机监测)或旋转目标 (OBB),YOLO26 的高级损失函数 (ProgLoss + STAL) 可提供巨大的精度优势。

何时选择 YOLOv5

  • 遗留系统: 如果你的生产环境对 YOLOv5 特定的锚框生成或 NMS 解析逻辑有硬编码依赖,迁移可能需要一段简短的重构期。
  • 特定学术基准: 研究人员经常使用 YOLOv5 作为经典基准,以展示 目标检测架构 的历史演进。

总结

从 YOLOv5 到 YOLO26 的过渡不仅仅是一次迭代更新;它是目标检测模型训练和部署方式的一次根本性飞跃。通过利用 MuSGD 优化器、通过无 NMS 设计舍弃复杂的后处理,以及大幅提升 CPU 速度,Ultralytics YOLO26 在速度和精度之间实现了完美的平衡。

虽然 YOLOv5 将永远作为让视觉 AI 普及化的模型被铭记,但寻求构建稳健、可用于生产且面向未来的应用的开发者应自信地基于 YOLO26 进行开发。

评论