跳转至内容

YOLOv6.0 与YOLOv5:物体检测技术比较

为计算机视觉项目选择合适的架构是一个关键性的决定,它影响着性能、部署的便捷性和长期维护。在实时物体检测领域,美团的YOLOv6.0和Ultralytics 的 YOLOv5.本指南提供了详细的技术比较,帮助开发人员和研究人员选择最符合其特定要求的模型,无论是优先考虑原始GPU 吞吐量还是多功能、易用的生态系统。

性能指标分析

下表直接比较了COCO 数据集的性能指标。YOLOv6.0挑战了GPU 设备峰值精度的极限、 Ultralytics YOLOv5的轻量级变体保持了卓越的效率(尤其是在CPU 上)和显著降低的模型复杂性(参数和 FLOPs)。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

分析结果 数据显示,YOLOv5n(纳米)模型在资源有限的环境中表现突出,拥有最低的参数数(2.6M)和 FLOPs(7.7B),这意味着卓越的CPU 推理速度。这使它非常适合内存和电力稀缺的边缘人工智能应用。相反,YOLOv6.0 的目标是以增加模型大小为代价,获得更高的mAPval,因此非常适合配备专用GPU 硬件的工业设备。

美团YOLOv6.0:工业精度

作者李楚怡、李璐璐、耿一飞、蒋洪亮、程萌、张博、柯在丹、徐晓明、储祥祥
组织美团网
日期:2023-01-13
Arxiv https://arxiv.org/abs/2301.05586
GitHubYOLOv6https://github.com/meituan/YOLOv6
文档ultralytics

YOLOv6.0由美团开发,是专为工业应用定制的对象检测框架。它专注于在推理速度和准确性之间实现有利的权衡,特别是针对 GPU 上的硬件感知性能进行了优化。

架构和主要特性

YOLOv6 采用了高效的主干设计和可重新参数化的结构(RepVGG-style),在推理过程中简化了模型,同时在训练过程中保持了复杂的特征提取能力。3.0 版引入了自馏分和锚点辅助训练策略等技术,进一步提高了性能。

优势与劣势

  • GPU 精确度高:COCO 数据集上提供极具竞争力的mAP 分数,使其适用于制造业的质量控制任务。
  • 量化支持:提供对模型量化的特定支持,以加快部署速度。
  • 通用性有限:它主要针对物体检测而设计,缺乏对更广泛任务的本地支持,如其他框架中的实例分割或姿势估计 。
  • 更高的资源开销:与同等的轻量级YOLOv5 模型相比,大型变体需要更多内存和计算能力。

了解有关YOLOv6的更多信息

Ultralytics YOLOv5:生态系统标准

作者: Glenn JocherGlenn Jocher
组织Ultralytics
日期:2020-06-26
GitHubyolov5https://github.com/ultralytics/yolov5
文档 :yolov5

Ultralytics YOLOv5YOLOv5 是计算机视觉领域的传奇机型,因其以用户为中心的设计、可靠性和全面的生态系统而闻名于世。由于兼顾了速度、准确性和易用性,它一直是全球部署最多的模型之一。

架构和主要特性

YOLOv5 利用 CSPDarknet 主干网和 PANet 颈网进行稳健的特征融合。它采用了一种基于锚的检测机制,该机制在不同的数据集上都被证明是高度稳定的。该架构高度模块化,提供五种规模(n、s、m、l、x),适用于从嵌入式设备到云服务器的所有设备。

为什么选择YOLOv5?

  • 易于使用: Ultralytics 采用简单的Python 应用程序接口、自动环境设置和丰富的文档,将开发人员的使用体验放在首位。
  • 多功能性:与许多竞争对手不同,YOLOv5 开箱即支持图像分类实例分割
  • 训练效率:训练过程中收敛速度快、内存使用量低,可节省计算资源成本。
  • 部署灵活:无缝导出为以下格式 ONNX, TensorRT、CoreML 和TFLite 等格式,实现多种硬件集成。

综合生态系统

使用YOLOv5 的最大优势之一是Ultralytics 生态系统。通过与Ultralytics HUB等工具的集成,可以实现无代码模型训练和预览,同时内置支持通过 CometMLflow对实验跟踪的内置支持简化了 MLOps 工作流程。

了解更多关于 YOLOv5 的信息

详细比较

建筑与设计理念

YOLOv6.0 在很大程度上依赖于硬件感知神经架构搜索和重新参数化,以最大限度地提高特定GPU 架构(如 Tesla T4)的吞吐量。相比之下 YOLOv5侧重于通用设计,可在 CPU、GPU 和 NPU 上可靠地运行。与某些无锚方法相比,YOLOv5 基于锚检测器通常更容易调整,以适应具有小对象的自定义数据集。

可用性和培训方法

Ultralytics 模型设计为 "可随时训练"。在YOLOv5 中,AutoAnchor等功能可根据数据集标签自动调整锚点框,智能超参数演化可帮助找到最佳训练设置。YOLOv6 需要更多传统研究资源库所特有的手动设置,这可能会给新用户带来更陡峭的学习曲线。

实际应用案例

  • Ultralytics YOLOv5: 快速原型开发和多样化部署的理想选择。其轻量级 "纳米 "模型非常适合基于无人机的监测或需要在CPU 上进行实时推理的移动应用程序。它对分割的支持也使其在医学成像任务(如细胞分割)中非常有价值。
  • YOLOv6.0:最适合有高端 GPU 的固定工业环境,主要指标是mAP。例如电子制造业中的自动光学检测 (AOI)。

代码示例:运行YOLOv5

YOLOv5 的简易性体现在它只需几行代码就能使用PyTorch Hub 运行推理。这省去了复杂的安装步骤,使开发人员能够立即测试模型。

import torch

# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.show()

# Print detailed results regarding detected objects
results.print()

这种易用性是Ultralytics 理念的一大特点,使计算机视觉从业人员能够专注于解决问题,而不是调试环境问题。

结论

这两种架构在现代视觉领域都发挥着重要作用。美团YOLOv6.0为专注于在GPU 硬件上最大限度提高检测精度的用户提供了一个极具吸引力的选择。

然而 Ultralytics YOLOv5凭借其无与伦比的多功能性训练效率强大的生态系统,仍然是大多数开发人员的首选。YOLOv5 能够轻松部署到边缘设备,并支持细分和分类,是应对真实世界人工智能挑战的全面解决方案。

对于那些寻求最先进性能的用户,我们建议您探索 Ultralytics YOLO11.YOLO11 以YOLOv5 为基础,具有更高的准确性、更快的速度和更丰富的功能,代表了视觉人工智能的未来。其他专业模型,如 RT-DETR等其他专用模型也可用于transformer应用。

Ultralytics 模型文档中探索各种工具和模型。


评论