跳转至内容

YOLOv6 与YOLOv6.0:技术比较

选择理想的物体检测架构是计算机视觉工程师的关键决策,通常需要在精度、推理延迟和硬件限制之间取得谨慎的平衡。本指南提供了全面的技术分析,比较了阿里巴巴集团的高精度模型YOLOv6 和美团以效率为中心的框架YOLOv6.0

我们研究了它们在架构上的创新、在标准数据集上的基准性能,以及在实际部署中的适用性。此外,我们还探讨了 Ultralytics YOLO11如何为寻求统一解决方案的开发人员提供一种现代化的多功能替代方案。

DAMO-YOLO 概述

YOLO 是阿里巴巴集团开发的一种尖端物体检测方法。它通过采用神经架构搜索(NAS)和多个旨在消除计算瓶颈的新型模块,在速度和准确性之间进行了优先权衡。

作者:徐先哲、蒋一琪、陈伟华、黄一伦、张远、孙秀玉Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
Organization:Alibaba Group
Date:2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO
DocsYOLO

架构和主要特性

YOLO 采用了 "从小到大 "的扩展策略,并辅以独特的架构设计。主要组件包括

  • MAE-NAS 主干网:利用神经架构搜索(NAS),该模型采用了结构各异的 MazeNet 主干网,以便在不同的计算预算下最大限度地提高特征提取效率。
  • 高效的 RepGFPN:通过重新参数化(Rep)增强的广义特征金字塔网络(GFPN)可实现卓越的多尺度特征融合。这种设计确保了低层次空间信息和高层次语义信息的有效结合,而不会产生高昂的延迟成本。
  • ZeroHead:极简的检测头设计("ZeroHead")可显著减少参数数量。通过有效解耦分类和回归任务,它在精简最终预测层的同时保持了高性能。
  • AlignedOTA:一种先进的标签分配策略,可解决分类分数与回归之间的不一致问题 IoU(Intersection over Union) 之间的错位,确保模型在训练过程中专注于高质量的锚点。

优势与劣势

YOLO 在各种情况下都能大显身手。 mAP是至关重要的。

  • 优点

    • 高精确度:由于其 NAS 优化骨干网,在中小型企业的mAP 中,其性能往往优于同类模型。
    • 创新设计:ZeroHead 概念减少了检测头通常存在的沉重计算负荷。
    • 强蒸馏:包括一个强大的蒸馏机制(知识蒸馏),可利用较大的教师网络提高较小的学生模型的性能。
  • 缺点

    • 复杂的架构:与基于标准 CSP 的设计相比,使用 NAS 生成的主干网会使架构更难定制或调试。
    • 有限的生态系统:作为一个以研究为重点的版本,它缺乏更广泛生态系统中的广泛第三方工具集成。
    • 延迟变化:NAS 结构虽然经过优化,但不一定能像标准 CNN 那样完美地映射到特定的硬件加速器上。

理想用例

  • 智能城市监控:需要高精度detect 远距离行人或车辆等小物体。
  • 自动质量检测:在精度要求极高的生产线上识别细微缺陷。

了解更多关于 DAMO-YOLO 的信息

YOLOv6.0 概览

YOLOv6.0是美团开发的YOLOv6 框架的第三次迭代。它专为工业应用而设计,强调 GPU 的高吞吐量和易于部署。

作者:李楚一、李露露、耿一飞、蒋洪亮、程萌、张博、柯在丹、徐晓明、储祥祥李楚怡、李露露、耿一飞、蒋洪亮、程萌、张博、柯在丹、徐晓明、储祥祥
机构:美团网
日期:2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics

架构和主要特性

YOLOv6.0 专注于硬件友好型设计,可最大限度地提高 GPU利用率:

  • EfficientRep 主干网:骨干网使用可重新参数化的块,将复杂的训练时结构浓缩为简单的 3x3 卷积进行推理,从而提高了在NVIDIA TensorRT 等硬件上的运行速度。
  • Rep-PAN 颈部:颈部架构兼顾了功能融合能力和硬件效率,确保数据在网络中顺畅流动,不会出现瓶颈。
  • 双向并集(BiC):通过改进不同尺度的特征聚合方式来提高定位精度。
  • 锚点辅助训练(AAT):一种混合策略,在训练阶段结合了基于锚和无锚范例的优势,以稳定收敛并提高最终精度。

优势与劣势

YOLOv6.0 对于需要标准GPU 部署的工业环境来说是一个强大的工具。

  • 优点

    • 推理速度: 字段 nano 该变体速度极快,非常适合高分辨率要求。
    • 硬件优化:明确为GPU 吞吐量而设计,在TensorRT 量化时表现出色。
    • 简化部署:重新参数化简化了最终图形,减少了导出时的兼容性问题。
  • 缺点

    • 专注于单一任务:主要用于物体检测,与多任务框架相比,在核心资源库中缺乏对分割或姿势估计 本地支持。
    • 参数效率:与某些竞争对手相比,较大的变体在参数方面可以更多,但精度却能提高。

理想用例

  • 工业自动化:生产线上的高速分拣和装配验证。
  • 零售分析:用于货架监控和顾客行为分析的实时推理
  • 边缘计算:在移动或嵌入式设备上部署YOLOv6 等轻量级模型。

了解有关YOLOv6的更多信息

性能分析

下面的比较突出显示了两个模型在COCO 数据集上的性能。度量指标侧重于IoU 0.5-0.95 时的验证mAP (平均精度)、使用TensorRT 在 T4 GPU 上的推理速度以及模型复杂度(参数和 FLOPs)。

性能洞察

YOLOv6.0n是速度冠军,推理速度低于 2 毫秒,非常适合对延迟极为敏感的应用。不过,YOLO-YOLO型号(特别是小型和中型变体)的mAP 分数往往高于YOLOv6 型号,这表明它们的 NAS 主干网具有强大的架构效率。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

Ultralytics 的优势

YOLO 和YOLOv6.0 为特定的利基市场提供了引人注目的功能、 Ultralytics YOLO11代表了计算机视觉人工智能的全面发展。YOLO11 专为需要的不仅仅是检测模型的开发人员设计,它将最先进的性能与无与伦比的用户体验融为一体。

为什么选择Ultralytics YOLO?

  • 统一的生态系统:与独立的研究资料库不同,Ultralytics 提供的是一个综合平台。从数据注释到模型训练和部署,工作流程无缝衔接。GitHubDiscord上活跃的社区确保您不会孤立地进行开发。
  • 无与伦比的多功能性:单一的YOLO11 模型架构支持广泛的计算机视觉任务,包括物体检测、实例分割姿势估计 定向边框(旋转框检测)分类。这种灵活性使您无需切换框架即可处理复杂的项目。
  • 训练效率: Ultralytics 模型针对训练效率进行了优化,所需的GPU 内存通常比transformer替代方案少得多。自动批量大小确定和混合精度训练 (AMP) 等功能默认启用,从而简化了从数据到部署的路径。
  • 易用性: Python 应用程序接口设计简单。您可以加载预训练模型,在图像上运行推理,并将其导出为以下格式 ONNXTensorRT等格式导出。
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on your custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export the model to ONNX format for deployment
model.export(format="onnx")

结论

对于严格要求在工业 GPU 上实现最高吞吐量的项目,YOLOv6.0是一个强有力的竞争者。如果您的重点是利用 NAS 在特定参数预算内最大限度地提高精确度,YOLO-YOLO则是一个出色的研究级选择。

然而,对于绝大多数商业和研究应用而言,超光谱分析技术并不适合、 Ultralytics YOLO11提供了性能、可用性和长期可维护性之间的最佳平衡。其处理多种任务的能力,加上强大且维护良好的生态系统,使其成为构建可扩展计算机视觉解决方案的推荐选择。

探索其他模型

通过探索这些其他详细的比较,加深您对物体检测领域的了解:


评论