YOLOv9 与 YOLOv6-3.0:详细比较
在选择对象检测计算机视觉模型时,了解不同架构之间的细微差别至关重要。本页提供了 YOLOv9 和 YOLOv6-3.0 这两个YOLO 系列最先进模型之间的详细技术比较。我们深入探讨了它们的架构设计、性能基准和合适的应用,以帮助您做出明智的决定。
建筑概览
YOLOv9 由台湾中央研究院信息科学研究所的 Wang 和 Liao 于 2024 年初推出,通过解决深度网络中的信息丢失问题,实现了物体检测领域的重大飞跃。它引入了两项关键创新:
- 可编程梯度信息 (PGI):该机制旨在保留整个网络中的关键信息,减少信息丢失,这对更深、更复杂的架构尤为有利。
- 通用高效层聚合网络(GELAN):GELAN 可优化网络结构,提高参数利用率和计算效率,从而实现更快、更准确的检测。
与前代产品相比,YOLOv9 的这些进步使其能够以更少的参数实现更高的准确性。他们在 arXiv 上发表的论文《YOLOv9:利用可编程梯度信息学习你想学的东西》详细介绍了这一架构。正式代码也可在GitHub 上获取。
YOLOv6-3.0由美团公司开发,详情见其2023年发表的论文《YOLOv6 v3.0.全面重装》:YOLOv6 v3.0:全面重装"中详细介绍,其重点是在速度和精度之间取得平衡,因此非常适合工业应用和实时系统。其架构亮点包括
- 双向串联(BiC)模块:该模块可增强网络颈部内的定位信号,在不明显影响速度的情况下提高检测精度。
- 锚定辅助训练(AAT)策略:锚定辅助训练(AAT)有助于更有效地进行训练,从而提高模型的整体性能。
YOLOv6-3.0 的设计旨在提高效率,优先考虑更快的推理时间和更小的模型尺寸。代码库可在GitHub 上公开访问。
性能指标
下表比较了 YOLOv9 和 YOLOv6-3.0 模型在 COCO 数据集上的性能。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
分析:
- 准确度(mAP):YOLOv9 模型的 mAP 分数普遍较高,表明其物体检测准确度较高,尤其是在较大的模型尺寸(m、c、e)中。例如,YOLOv9e 的 mAPval50-95 为 55.6%,超过 YOLOv6-3.0l 的 52.8%。
- 推理速度:YOLOv6-3.0 模型的推理速度明显更快,尤其是 YOLOv6-3.0n 和 YOLOv6-3.0s 等较小的变体。YOLOv6-3.0n 的TensorRT 速度为 1.17ms,明显快于 YOLOv9t 的 2.3ms。
- 模型大小和 FLOPs:在某些大小类别中,YOLOv9 模型往往比 YOLOv6-3.0 具有更少的参数和更低的 FLOPs,但却具有相当或更高的精度,这展示了其架构的效率。例如,YOLOv9c 的参数(25.3M)和 FLOPs(102.1B)均少于 YOLOv6-3.0l(59.6M 和 150.7B),但精度却保持相当。
使用案例
YOLOv9:
- 高精度要求:非常适合精度要求极高的应用,如自动驾驶、高级监控系统和详细的医学成像分析。
- 复杂场景:适用于背景复杂或有大量小物体的场景,在这些场景中,保存特征信息至关重要。
- 研发:适用于突破物体检测性能的极限,探索新的架构优化。
YOLOv6-3.0:
- 实时应用:最适合需要快速推理的应用,如实时视频分析、机器人和无人机系统。
- 资源有限的设备:由于设计高效,模型尺寸较小,因此可在计算资源有限的边缘设备、移动平台和系统上优化部署。
- 工业应用:非常适合需要进行强大而快速的目标检测的工业环境,如质量控制、自动检测和安全监控等任务。
培训与实施
YOLOv9 和 YOLOv6-3.0 都可以使用PyTorch 等流行的深度学习框架进行训练和实施。Ultralytics 为这两个模型提供了全面的文档和支持,使研究人员和开发人员都能使用它们。您可以在Ultralytics 官方文档中找到有关YOLOv9和YOLOv6 的训练、验证和部署的详细指南。
结论
在 YOLOv9 和 YOLOv6-3.0 之间做出选择主要取决于项目的具体要求。如果精度是重中之重,而且计算资源的限制较少,那么 YOLOv9 可以提供最先进的性能。相反,如果对实时或边缘部署的速度和效率要求很高,YOLOv6-3.0 则能在速度和合理的精确度之间取得很好的平衡。
对于有兴趣探索其他模型的用户,Ultralytics 还提供多种YOLO 模型,包括 YOLOv8, YOLOv5和 YOLO11每个模型都具有针对不同用例的独特优势。请考虑探索这些模型,以找到最适合您的计算机视觉需求的模型。