跳转至内容

YOLO11 与 YOLOv8:架构演进与性能分析

选择最优的计算机视觉模型是开发人员和研究人员在平衡准确性、速度和资源效率方面的关键决策。本页面对Ultralytics YOLO11Ultralytics YOLOv8(两款专为对象detect和高级视觉任务设计的行业领先架构)进行了全面的技术比较。我们分析了它们的架构创新、基准指标和理想部署场景,以帮助您确定最适合您的人工智能应用的模型。

Ultralytics YOLO11

作者: Glenn Jocher, Jing Qiu
机构:Ultralytics
日期: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
文档:https://docs.ultralytics.com/models/yolo11/

YOLO11 代表了著名 YOLO 系列的最新演进,在特征提取和处理效率方面实现了显著提升。通过优化主干和颈部架构,YOLO11 在使用比前代更少参数的情况下,实现了更高的平均精度均值 (mAP)。它原生支持广泛的任务,包括实例分割图像分类姿势估计和 obb。

架构和主要特性

YOLO11 架构引入了 C3k2 块(CSP(跨阶段部分)瓶颈的优化版本)和 C2PSA(带空间注意力的跨阶段部分)模块。这些组件增强了模型捕获复杂视觉模式和空间关系的能力,同时最大限度地减少了计算开销。这种设计理念确保 YOLO11 在实时推理场景中表现出色,尤其是在计算资源有限的边缘设备上。

优势

  • 领先的准确性:在所有模型尺度上提供卓越的 detect 性能,在 COCO 数据集上持续超越以前的迭代版本。
  • CPU 效率:优化的架构选择显著提升了 CPU 上的推理速度,使其成为无服务器或边缘部署的首选。
  • 参数效率:以更少的参数和 FLOPs 实现高精度,降低了 模型存储 要求。
  • 统一框架: 在一个易于使用的单一API中无缝处理多种视觉任务。

弱点

  • 生态系统成熟度:作为一项较新的发布,第三方教程和社区生成内容的数量正在快速增长,但可能不如成熟的 YOLOv8 广泛。
  • 大型模型的资源密集度:尽管高效,但最大的变体(例如YOLO11x)在训练和高吞吐量推理时仍需要大量的GPU资源。

应用案例

YOLO11 是需要最高精度速度比的应用的首选:

  • 边缘AI:NVIDIA Jetson或树莓派设备上部署高性能检测。
  • 实时机器人技术: 以最小延迟实现自主导航和物体交互。
  • 医学成像:协助进行精确的医学图像分析以进行诊断,其中准确性至关重要。

了解更多关于 YOLO11 的信息

Ultralytics YOLOv8

作者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
机构:Ultralytics
日期: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
文档:https://docs.ultralytics.com/models/yolov8/

YOLOv8于2023年初发布,重新定义了实时目标检测的标准。它引入了无锚点检测头和C2f骨干模块,标志着与基于锚点的方法的重大背离。YOLOv8以其稳定性、多功能性以及围绕它发展起来的庞大生态系统而闻名,使其成为全球最广泛采用的视觉模型之一。

架构和主要特性

YOLOv8 采用了 CSPDarknet53 主干网络的修改版,其中融入了 C2f 模块,以实现更丰富的梯度流。其无锚框设计简化了非极大值抑制 (NMS)过程,并降低了与锚框相关的超参数调优的复杂性。该模型具有高度可扩展性,提供从 Nano (n) 到 Extra Large (x) 的各种变体,以适应不同的计算预算。

优势

  • 经验证的可靠性:在全球生产环境中经过广泛测试,确保高稳定性。
  • 丰富的生态系统:由数千个教程、集成和社区项目提供支持。
  • 多功能性:与 YOLO11 类似,它支持 detect、segmentation、分类和姿势估计。
  • 强劲基线:持续提供具有竞争力的性能,超越了许多非YOLO架构。

弱点

  • 性能差距:在准确性(mAP)和推理速度方面通常被 YOLO11 超越,尤其是在 CPU 硬件上。
  • 更高的计算成本:需要略多的参数和FLOPs才能达到与YOLO11相当的精度。

应用案例

YOLOv8 仍然是以下方面的绝佳选择:

  • 传统系统:已与 YOLOv8 工作流集成的项目,相比于尖端性能更注重稳定性。
  • 教育工具: 使用具有丰富文档和社区示例的模型学习计算机视觉概念。
  • 通用检测:适用于标准安全和监控应用的可靠性能。

了解更多关于 YOLOv8 的信息

性能正面交锋

这两种模型之间最显著的区别在于它们的效率。YOLO11 相对于 YOLOv8 实现了“帕累托改进”——以更低的计算成本提供更高的准确性。

效率与速度分析

YOLO11 (C3k2, C2PSA) 中的架构优化使其能够更快地处理图像,同时保留更精细的特征。这在CPU 推理中最为明显,YOLO11 模型显示出显著的加速。例如,YOLO11n 模型在 CPU 上的速度比 YOLOv8n 快约30%,同时实现了更高的 mAP。

GPU 推理方面,YOLO11 模型在大多数尺寸上也表现出较低的延迟,使其在实时视频处理管道中非常有效。

内存效率

RT-DETR 等基于 Transformer 的模型相比,Ultralytics YOLO11 和 YOLOv8 在训练和推理过程中都设计为低内存消耗。这使得它们对于使用消费级硬件或 CUDA 内存有限的云环境的开发者来说更易于访问。

对比指标

下表说明了性能提升。请注意YOLO11的参数和FLOPs的减少以及mAP的增加。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Ultralytics 生态系统优势

选择 Ultralytics 模型意味着获得一个全面的生态系统,旨在简化整个 MLOps 生命周期。

  • 易用性: 两种模型都具有相同的 Python API 和命令行界面 (CLI)。从 YOLOv8 切换到 YOLO11 通常只需更改代码字符串中的一个字符(例如, "yolov8n.pt""yolo11n.pt")。
  • 训练效率:Ultralytics 模型利用包括马赛克增强和超参数进化在内的先进训练例程。预训练权重随时可用,可在自定义数据集上实现高效的迁移学习
  • 多功能性:与许多仅限于特定任务的竞争对手不同,Ultralytics模型在一个统一的软件包中原生支持detect、segment、classification、姿势估计和obb。
  • 部署:轻松将模型导出为 ONNXTensorRT、CoreML 和 OpenVINO 等格式,以便在各种硬件上进行优化部署。

统一使用示例

共享的API设计使得实验变得轻松。以下是您如何使用任一模型加载并运行预测的方法:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

结论:您应该选择哪种模型?

对于绝大多数新项目,YOLO11是推荐的选择。其架构进步在精度和速度方面都提供了明显优势,特别是对于效率至关重要的边缘计算应用。参数数量的减少也意味着更轻的存储需求和更快的移动部署下载时间。

YOLOv8仍然是一个功能强大的相关工具,特别是对于那些将现有管道与特定YOLOv8 版本深度集成的团队,或者那些依赖其绝对成熟的文档生态系统的团队。不过,迁移到YOLO11 一般都很简单,并能立即产生性能效益。

两种模型均在AGPL-3.0许可下发布,促进开源协作,并提供企业许可证,适用于需要专有功能的商业产品。

探索其他模型

尽管 YOLO11 和 YOLOv8 是优秀的通用 detect 器,但特定需求可能受益于 Ultralytics 系列中的其他架构:

  • YOLOv10: 专注于无 NMS 训练,以降低延迟。
  • YOLOv9: 强调用于深度模型训练的可编程梯度信息。
  • RT-DETR: 一种基于 Transformer 的 detector,可提供高精度,但需要更高的内存和计算资源。

探索我们完整的模型比较系列,为您的项目找到完美匹配。


评论