YOLOv5 vs YOLO11:全面的技术对比

在为新项目选择合适的计算机视觉架构时,了解尖端模型的发展历程至关重要。从早期架构到现代统一框架的演进,突显了算法效率和开发者体验方面的重大飞跃。本指南对 Ultralytics 开发的两款里程碑式模型进行了深入的技术对比:开创性的 YOLOv5 和高度优化的 YOLO11。

模型简介

这两种架构都代表了实时目标检测领域的重大里程碑,根据你的部署环境和遗留需求,它们各具优势。

YOLOv5:行业的中流砥柱

YOLOv5 发布于 2020 年夏季,因其原生的 PyTorch 实现而迅速成为行业标准,这极大地降低了训练和部署的门槛。它摒弃了前身复杂的 Darknet C 框架,为模型构建提供了一种 Pythonic(符合 Python 风格)的方法。

YOLOv5 为易用性建立了强大的基准,并引入了强大的训练方法,包括先进的马赛克(mosaic)数据增强和自动锚框(auto-anchoring)。对于在文档完善、经过大量测试的代码库基础上进行构建的研究人员来说,它仍然非常受欢迎。

了解更多关于 YOLOv5 的信息

YOLO11:统一视觉框架

基于多年的反馈和架构研究,YOLO11 作为能够原生处理多种视觉任务的统一框架的一部分被引入。它不仅超越了简单的边界框,而且从一开始就是为了实现最大的通用性和效率而设计的。

YOLO11 通过 ultralytics Python 包提供了精简的用户体验,并拥有一个统一的 API,集成了 目标检测、实例分割、分类、姿态估计和旋转边界框(OBB)。它在速度和准确性之间实现了极佳的平衡,使其非常适合各种实际部署场景。

了解关于 YOLO11 的更多信息

集成平台

这两个模型都受益于 Ultralytics Platform 提供的维护良好的生态系统。这一集成环境简化了数据集标注、云端训练以及针对各种硬件目标的模型导出。

性能与指标对比

A direct comparison of these models reveals how architectural refinements translate to tangible performance gains. The table below illustrates the mean Average Precision (mAP) evaluated on the COCO dataset, alongside CPU and GPU inference speeds and parameter counts.

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

结果分析

这些指标突显了 YOLO11 在 性能平衡 上的明显飞跃。例如,YOLO11n (nano) 模型达到了 39.5% 的 mAP,而 YOLOv5n 为 28.0%,同时在通过 ONNX 导出时还缩短了 CPU 推理时间。此外,与基于 Transformer 的重量级模型相比,YOLO11 在训练期间保持了显著更低的内存需求,使其在消费级硬件和边缘设备上的部署更具可行性。

架构差异

YOLO11 的性能改进源于几个关键的架构演进。虽然 YOLOv5 使用了带有 C3 模块的标准 CSPNet 主干,但 YOLO11 引入了更高效的特征提取块,如 C2f 和后来的 C3k2,它们优化了梯度流并减少了计算开销。

YOLO11 还拥有经过深度优化的头部。摒弃了旧模型基于锚框(anchor-based)的设计,较新的 Ultralytics 架构采用了无锚框(anchor-free)方法。这减少了框预测的数量,简化了后处理流水线,并提高了模型在不同尺度和宽高比下的泛化能力。此外,这些模型还具备卓越的 训练效率 和随时可用的预训练权重,能够加速微调数据集的收敛。

实现与代码示例

Ultralytics 生态系统的显著特点之一就是简单性。虽然 YOLOv5 通过 torch.hub 普及了快速推理,但 YOLO11 通过统一的 ultralytics Python 包将这一点推向了新的高度。

使用 YOLO11 进行训练

加载、训练和验证模型仅需最少的样板代码。该 API 可以无缝处理超参数调优和模型管理。

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")

# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")

使用 YOLOv5 进行遗留推理

如果你正在维护旧的流水线,YOLOv5 可直接与 PyTorch 的原生加载机制集成,这使得将其嵌入现有的推理脚本中变得非常简单。

import torch

# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")

# Print prediction details to the console
results.print()
部署灵活性

Both models support extensive export formats. Whether you are targeting an NVIDIA Jetson using TensorRT or an iOS application using CoreML, the deployment process is thoroughly documented and supported by the community.

理想用例

在这些模型之间进行选择,主要取决于你的项目生命周期阶段和具体要求。

何时选择 YOLOv5

  • 维护遗留代码库: 如果你的生产环境围绕 YOLOv5 仓库结构或特定的 超参数进化 技术进行了深度定制。
  • 学术基准: 在发表需要与既定的 2020-2022 年计算机视觉标准进行直接基准测试的研究时。

何时选择 YOLO11

  • 多任务项目: 当你的应用需要通过单一统一的 API 组合使用诸如 姿态估计实例分割 等任务时。
  • 边缘部署: 对于 边缘计算 场景,在给定的计算预算(FLOPs)下榨取最大 mAP 至关重要时。
  • 商业 AI 解决方案: 是零售和安全领域企业级应用的理想选择,能够利用 Ultralytics Platform 提供的强大支持。

下一代:Ultralytics YOLO26

虽然 YOLO11 在速度和准确性之间取得了极佳的平衡,但人工智能领域发展迅速。对于今天开始新项目的开发者,我们强烈建议探索视觉 AI 的最新标准:Ultralytics YOLO26

YOLO26 发布于 2026 年 1 月,引入了专为现代部署需求设计的范式转换进展:

  • 端到端无 NMS 设计: 基于 YOLOv10 首次开创的概念,YOLO26 原生支持端到端。它消除了对非极大值抑制(NMS)后处理的需求,显著简化了部署流水线并降低了延迟。
  • MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 等模型的 LLM 训练创新启发,这种 SGD 和 Muon 的混合体确保了极其稳定的训练和更快的收敛速度。
  • 前所未有的 CPU 速度: 通过移除分布式焦点损失(DFL),YOLO26 实现了高达 43% 的 CPU 推理加速,使其成为边缘设备和无专用 GPU 环境的绝对最佳选择。
  • 高级损失函数: ProgLoss 和 STAL 的集成在小目标识别方面产生了显著的提升,这对无人机分析、物联网和机器人技术至关重要。
  • 特定任务增强: 它引入了专业化的优化,例如用于姿态估计的残差对数似然估计(RLE)以及用于 旋转边界框 的专业角度损失,确保在所有计算机视觉任务中都能表现出卓越的性能。

了解关于 YOLO26 的更多信息

对于对标准目标检测之外的专业架构感兴趣的用户,你也可以探索诸如用于 Transformer 检测的 RT-DETR,或用于开放词汇跟踪和检测的 YOLO-World。拥抱这些维护良好且高度优化的工具,确保你的计算机视觉流水线保持高效、可扩展,并始终处于领先地位。

评论