Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 对比 YOLO11#

在为新项目选择合适的计算机视觉架构时,了解最先进模型的发展演变至关重要。从早期架构到现代统一框架的演进,彰显了算法效率和开发者体验方面的重大飞跃。本指南对 Ultralytics 开发的两个里程碑式模型进行了深入的技术对比:开创性的 YOLOv5 和高度优化的 YOLO11。

Link to this section模型简介#

这两种架构都代表了实时目标检测领域的重大里程碑,根据你的部署环境和旧有需求,它们各自提供独特的优势。

Link to this sectionYOLOv5:行业主力#

YOLOv5 于 2020 年夏季发布,凭借其原生的 PyTorch 实现迅速成为行业标准,极大地降低了训练和部署的门槛。它摒弃了其前辈复杂的 Darknet C 框架,提供了更加 Pythonic 的模型构建方式。

YOLOv5 为易用性建立了强大的基准,并引入了强大的训练方法,包括先进的 Mosaic 数据增强和自动锚框(auto-anchoring)。对于在经过充分文档化、经过严格测试的代码库基础上进行构建的研究人员来说,它依然非常受欢迎。

了解更多关于 YOLOv5 的信息

Link to this sectionYOLO11:统一视觉框架#

基于多年的反馈和架构研究,YOLO11 作为统一框架的一部分被引入,能够原生处理多种视觉任务。它超越了单纯的边界框,从底层设计上实现了最大的多功能性和效率。

YOLO11 通过 ultralytics Python 包提供了精简的用户体验,拥有一个简单的 API,统一了 目标检测、实例分割、分类、姿态估计和旋转边界框(OBB)。它在速度和精度之间取得了非常理想的平衡,使其非常适合各种实际部署场景。

了解更多关于 YOLO11 的信息

集成平台

这两个模型都受益于 Ultralytics Platform 提供的维护良好的生态系统。这一集成环境简化了跨各种硬件目标的数据集标注、云端训练和模型导出。

Link to this section性能与指标对比#

对这些模型进行直接对比,可以揭示架构上的改进如何转化为切实的性能提升。下表展示了在 COCO 数据集 上评估的平均精度均值(mAP),以及 CPU 和 GPU 的推理速度和参数量。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Link to this section结果分析#

这些指标突显了 YOLO11 在 性能平衡 方面实现的巨大飞跃。例如,YOLO11n (nano) 模型达到了 39.5% 的 mAP,而 YOLOv5n 为 28.0%,同时通过 ONNX 导出时还缩短了 CPU 推理时间。此外,与沉重的 Transformer 模型相比,YOLO11 在训练期间保持了显著更低的内存需求,使其非常易于在消费级硬件和边缘设备上部署。

Link to this section架构差异#

YOLO11 的性能改进源于多项关键的架构演进。YOLOv5 使用了带有 C3 模块的标准 CSPNet 主干,而 YOLO11 引入了更高效的特征提取块,如 C2f 和后来的 C3k2,优化了梯度流并降低了计算开销。

YOLO11 还具有经过大幅改进的检测头(head)。与旧模型基于锚框(anchor-based)的设计不同,较新的 Ultralytics 架构采用了无锚框(anchor-free)方法。这减少了框预测的数量,简化了后处理流程,并提高了模型在不同尺度和纵横比下的泛化能力。此外,这些模型拥有卓越的 训练效率,并且提供现成的预训练权重,可加速微调数据集的收敛。

Link to this section实现与代码示例#

Ultralytics 生态系统的显著特点之一就是简单。虽然 YOLOv5 普及了使用 torch.hub 进行快速推理,但 YOLO11 通过统一的 ultralytics Python 包更进一步。

Link to this section使用 YOLO11 进行训练#

加载、训练和验证模型只需极少的样板代码。API 可以无缝处理超参数调整和模型管理。

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

Link to this sectionYOLOv5 的旧有推理#

如果你正在维护旧的流水线,YOLOv5 直接与 PyTorch 的原生加载机制集成,使其可以轻松嵌入到现有的推理脚本中。

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()
部署灵活性

Both models support extensive export formats. Whether you are targeting an NVIDIA Jetson using TensorRT or an iOS application using CoreML, the deployment process is thoroughly documented and supported by the community.

Link to this section理想使用场景#

在这些模型之间进行选择,主要取决于你项目的生命周期阶段和具体需求。

Link to this section何时选择 YOLOv5#

  • 维护旧有代码库: 如果你的生产环境是围绕 YOLOv5 仓库结构或特定的 超参数进化 技术进行了深度定制。
  • 学术基准: 在发表需要与 2020-2022 年既定计算机视觉标准进行直接基准测试的研究时。

Link to this section何时选择 YOLO11#

  • 多任务项目: 当你的应用需要使用单个统一 API 混合执行 姿态估计实例分割 等任务时。
  • 边缘部署: 针对 边缘计算 场景,在给定的计算预算(FLOPs)下压榨出最大 mAP 至关重要时。
  • 商业 AI 解决方案: 利用 Ultralytics Platform 的强大支持,非常适合零售和安防领域的企业级应用。

Link to this section下一代:Ultralytics YOLO26#

虽然 YOLO11 在速度和精度之间取得了出色的平衡,但人工智能领域发展迅速。对于今天开始新项目的开发者,我们强烈建议探索视觉 AI 的最新标准:Ultralytics YOLO26

YOLO26 于 2026 年 1 月发布,引入了专门针对现代部署需求设计的范式转换进步:

  • 端到端无需 NMS 设计: 基于 YOLOv10 中首次提出的概念,YOLO26 原生支持端到端。它消除了对非极大值抑制(NMS)后处理的需求,显著简化了部署流水线并降低了延迟。
  • MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 等模型的 LLM 训练创新启发,这种 SGD 和 Muon 的混合体确保了极其稳定的训练和显著更快的收敛速度。
  • 前所未有的 CPU 速度: 通过移除分布焦点损失(DFL),YOLO26 的 CPU 推理速度提升高达 43%,使其成为边缘设备和没有专用 GPU 环境的绝对最佳选择。
  • 高级损失函数: ProgLoss 和 STAL 的集成在小目标识别方面取得了显著改进,这对于无人机分析、物联网和机器人技术至关重要。
  • 任务特定增强: 它引入了专业优化,如用于姿态估计的残差对数似然估计(RLE)以及用于 旋转边界框 的专业角度损失,确保在所有计算机视觉任务中均能获得卓越性能。

了解更多关于 YOLO26 的信息

对于对标准目标检测之外的专用架构感兴趣的用户,你可能还想探索诸如 RT-DETR 这样的 Transformer 模型,或用于开放词汇跟踪和检测的 YOLO-World。拥抱这些维护良好、高度优化的工具,可确保你的计算机视觉流水线保持高效、可扩展并处于领先地位。

评论