Link to this sectionYOLOv5 vs YOLO26#
计算机视觉的演进一直是由对更快、更准确、更易用模型的持续追求所定义的。在比较 Ultralytics YOLOv5 与尖端的 Ultralytics YOLO26 时,我们看到的是一种范式转移,它连接了稳健的传统系统与现代 AI 部署的最前沿。
本指南提供了这两种架构的全面技术细分,重点介绍了它们的性能指标、结构差异以及理想的部署场景。
Link to this section模型概述#
Link to this sectionYOLOv5:行业主力#
YOLOv5 于 2020 年发布,彻底改变了目标检测的易用性。通过将架构原生迁移至 PyTorch 框架,它为开发者提供了前所未有的“从零到精通”的体验。
- 作者: Glenn Jocher
- 组织: Ultralytics
- 日期: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- 文档: YOLOv5 文档
YOLOv5 为维护良好的 Ultralytics 生态系统奠定了基础。它引入了激进的数据增强技术、高效的训练循环以及针对 CoreML 和 ONNX 等边缘格式的高度优化导出路径。其易用性以及训练期间的低内存要求,使其成为全球创业公司和研究人员的首选。
Link to this sectionYOLO26:下一代视觉 AI 标准#
快进到 2026 年 1 月,Ultralytics YOLO26 代表了实时视觉 AI 的巅峰。它原生整合了 YOLOv8 和 YOLO11 等代际更迭所获得的经验,同时引入了受大语言模型 (LLM) 训练启发的重大突破。
- 作者: Glenn Jocher 和 Jing Qiu
- 组织: Ultralytics
- 日期: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: YOLO26 文档
YOLO26 为性能平衡树立了新的基准,在提供顶尖精度的同时,经过专门设计以主导边缘计算场景。
如果你正在迁移旧的代码库,你可能还会对比较 YOLOv5 与 YOLO11 感兴趣,这是前一代模型,它引入了对姿态估计和旋转边界框 (OBB) 等多样化任务的初步支持。
Link to this sectionYOLO26 的架构突破#
虽然 YOLOv5 依赖于基于锚点的检测头和标准损失函数,但 YOLO26 对内部机制进行了全面彻底的改革,消除了部署瓶颈。
- 端到端无 NMS 设计: 最显著的区别是 YOLO26 的原生端到端架构。与需要手动进行非极大值抑制 (NMS) 来过滤冗余边界框的 YOLOv5 不同,YOLO26 完全消除了这一后处理步骤。这确保了确定性的推理延迟,并大大简化了集成到 C++ 或嵌入式硬件中的过程。
- 移除 DFL: YOLO26 移除了分布焦点损失 (DFL)。这一架构选择极大地简化了模型导出,并增强了与低功耗边缘设备和微控制器的兼容性,这些设备通常难以处理复杂的算子。
- MuSGD 优化器: 借鉴了 Moonshot AI 的 Kimi K2,YOLO26 使用了 MuSGD 优化器,这是 SGD 和 Muon 的混合体。它将 LLM 训练中的稳定性和快速收敛性带到了计算机视觉领域,与重型 Transformer 模型相比,内存占用更低,训练周期更快。
- ProgLoss + STAL: YOLO26 利用了先进的 ProgLoss 和 STAL 函数,极大地提高了其检测小目标和密集目标的能力——这曾是 YOLOv5 的一个历史性挑战。
Link to this section性能比较#
当在 COCO 数据集 上比较这些模型时,YOLO26 在精度 (mAP) 方面展现出了巨大的提升,同时降低了参数量和 CPU 推理速度。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | 参数量 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
注:YOLO26 Nano (YOLO26n) 达到了惊人的 40.9 mAP,而 YOLOv5n 为 28.0 mAP;得益于 DFL 的移除和无 NMS 头部,其 CPU 推理速度最高可提升 43%。
Link to this section多功能性与任务支持#
YOLOv5 主要以 目标检测 而闻名。虽然后续更新引入了基础的分割功能,但 YOLO26 从一开始就是作为一个统一的多任务引擎构建的。
YOLO26 原生支持:
- 实例分割: 具备任务特定的多尺度原型和语义分割损失。
- 姿态估计: 利用残差对数似然估计 (RLE) 进行高精度的关键点检测。
- 旋转边界框 (OBB): 包含专门的角度损失以解决边界不连续问题,这对 卫星图像分析 至关重要。
- 图像分类: 标准的全图分类。
这两个模型都受益于 Ultralytics Platform,提供了无缝的数据标注、自动化超参数调优和一键云端部署。然而,YOLO26 充分利用了现代 API 结构。
Link to this section使用和代码示例#
Ultralytics Python API 让模型之间的切换变得极其简单。由于两个模型共享同一个维护良好的生态系统,将传统的 YOLOv5 流水线升级到 YOLO26 只需更改权重文件即可。
Link to this sectionPython 示例#
from ultralytics import YOLO
# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")
# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # YOLO26's low memory footprint allows larger batch sizes
)
# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Link to this sectionCLI 示例#
你可以使用 TensorRT 集成通过命令行直接部署 YOLO26,以获得最大的 GPU 吞吐量:
# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine
# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4Link to this section理想使用场景#
Link to this section何时选择 YOLO26#
对于任何现代计算机视觉项目,YOLO26 是毋庸置疑的推荐。
- 边缘 AI 和物联网: 其 CPU 推理速度提升了 43%,且移除了 DFL,这使其非常适合部署在 Raspberry Pi 或移动设备上。
- 高速流水线: 无 NMS 架构确保了稳定、可预测的延迟,这对于自动驾驶机器人和实时 安全报警系统 至关重要。
- 复杂场景: 如果你的应用需要跟踪小目标(例如 无人机监控)或旋转目标 (OBB),YOLO26 的高级损失函数 (ProgLoss + STAL) 提供了巨大的精度优势。
Link to this section何时选择 YOLOv5#
- 传统系统: 如果你的生产环境在 YOLOv5 特定的锚点生成或 NMS 解析逻辑上有硬编码依赖,迁移可能需要一段简短的重构期。
- 特定的学术基准: 研究人员经常使用 YOLOv5 作为经典基准,以展示 目标检测架构 的历史进展。
Link to this section总结#
从 YOLOv5 到 YOLO26 的过渡不仅仅是一次迭代更新,这是目标检测模型训练和部署方式上的根本性飞跃。通过利用 MuSGD 优化器、通过无 NMS 设计放弃复杂的后处理,以及大幅提升 CPU 速度,Ultralytics YOLO26 在速度和精度之间提供了无妥协的平衡。
虽然 YOLOv5 将永远作为让视觉 AI 普及化的模型被人们铭记,但希望构建稳健、可投入生产且面向未来应用的开发者,应充满信心地在 YOLO26 的基础上进行构建。