跳至内容

YOLOv9 与 YOLOv6-3.0:详细比较

在选择对象检测计算机视觉模型时,了解不同架构之间的细微差别至关重要。本页提供了 YOLOv9 和 YOLOv6-3.0 这两个YOLO 系列最先进模型之间的详细技术比较。我们深入探讨了它们的架构设计、性能基准和合适的应用,以帮助您做出明智的决定。

建筑概览

YOLOv9 由台湾中央研究院信息科学研究所的 Wang 和 Liao 于 2024 年初推出,通过解决深度网络中的信息丢失问题,实现了物体检测领域的重大飞跃。它引入了两项关键创新:

  • 可编程梯度信息 (PGI):该机制旨在保留整个网络中的关键信息,减少信息丢失,这对更深、更复杂的架构尤为有利。
  • 通用高效层聚合网络(GELAN):GELAN 可优化网络结构,提高参数利用率和计算效率,从而实现更快、更准确的检测。

与前代产品相比,YOLOv9 的这些进步使其能够以更少的参数实现更高的准确性。他们在 arXiv 上发表的论文《YOLOv9:利用可编程梯度信息学习你想学的东西》详细介绍了这一架构。正式代码也可在GitHub 上获取。

YOLOv6-3.0由美团公司开发,详情见其2023年发表的论文《YOLOv6 v3.0.全面重装》:YOLOv6 v3.0:全面重装"中详细介绍,其重点是在速度和精度之间取得平衡,因此非常适合工业应用和实时系统。其架构亮点包括

  • 双向串联(BiC)模块:该模块可增强网络颈部内的定位信号,在不明显影响速度的情况下提高检测精度。
  • 锚定辅助训练(AAT)策略:锚定辅助训练(AAT)有助于更有效地进行训练,从而提高模型的整体性能。

YOLOv6-3.0 的设计旨在提高效率,优先考虑更快的推理时间和更小的模型尺寸。代码库可在GitHub 上公开访问。

性能指标

下表比较了 YOLOv9 和 YOLOv6-3.0 模型在 COCO 数据集上的性能。

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

分析:

  • 准确度(mAP):YOLOv9 模型的 mAP 分数普遍较高,表明其物体检测准确度较高,尤其是在较大的模型尺寸(m、c、e)中。例如,YOLOv9e 的 mAPval50-95 为 55.6%,超过 YOLOv6-3.0l 的 52.8%。
  • 推理速度:YOLOv6-3.0 模型的推理速度明显更快,尤其是 YOLOv6-3.0n 和 YOLOv6-3.0s 等较小的变体。YOLOv6-3.0n 的TensorRT 速度为 1.17ms,明显快于 YOLOv9t 的 2.3ms。
  • 模型大小和 FLOPs:在某些大小类别中,YOLOv9 模型往往比 YOLOv6-3.0 具有更少的参数和更低的 FLOPs,但却具有相当或更高的精度,这展示了其架构的效率。例如,YOLOv9c 的参数(25.3M)和 FLOPs(102.1B)均少于 YOLOv6-3.0l(59.6M 和 150.7B),但精度却保持相当。

使用案例

YOLOv9:

  • 高精度要求:非常适合精度要求极高的应用,如自动驾驶、高级监控系统和详细的医学成像分析。
  • 复杂场景:适用于背景复杂或有大量小物体的场景,在这些场景中,保存特征信息至关重要。
  • 研发:适用于突破物体检测性能的极限,探索新的架构优化。

了解有关 YOLOv9 的更多信息

YOLOv6-3.0:

  • 实时应用:最适合需要快速推理的应用,如实时视频分析、机器人和无人机系统。
  • 资源有限的设备:由于设计高效,模型尺寸较小,因此可在计算资源有限的边缘设备、移动平台和系统上优化部署。
  • 工业应用:非常适合需要进行强大而快速的目标检测的工业环境,如质量控制、自动检测和安全监控等任务。

了解有关 YOLOv6 的更多信息

培训与实施

YOLOv9 和 YOLOv6-3.0 都可以使用PyTorch 等流行的深度学习框架进行训练和实施。Ultralytics 为这两个模型提供了全面的文档和支持,使研究人员和开发人员都能使用它们。您可以在Ultralytics 官方文档中找到有关YOLOv9YOLOv6 的训练、验证和部署的详细指南。

结论

在 YOLOv9 和 YOLOv6-3.0 之间做出选择主要取决于项目的具体要求。如果精度是重中之重,而且计算资源的限制较少,那么 YOLOv9 可以提供最先进的性能。相反,如果对实时或边缘部署的速度和效率要求很高,YOLOv6-3.0 则能在速度和合理的精确度之间取得很好的平衡。

对于有兴趣探索其他模型的用户,Ultralytics 还提供多种YOLO 模型,包括 YOLOv8, YOLOv5YOLO11每个模型都具有针对不同用例的独特优势。请考虑探索这些模型,以找到最适合您的计算机视觉需求的模型。

📅创建于 1 年前 ✏️已更新 1 个月前

评论