YOLO 与 YOLOv9:详细技术比较
选择最佳的物体检测模型对于计算机视觉任务至关重要,因为不同的模型在精度、速度和效率方面具有独特的优势。本页提供了YOLO 和 YOLOv9 这两种先进模型的技术比较。我们分析了它们的架构、性能基准和合适的应用,为您选择模型提供指导。
DAMO-YOLO
YOLO由阿里巴巴集团提出,于 2022 年 11 月推出(arXiv)。它强调速度与准确性之间的平衡,采用了神经架构搜索(NAS)骨干网和高效网络组件。
建筑与特色
YOLO 的建筑有几大创新之处:
- NAS 主干网:采用通过神经架构搜索优化的骨干网,以实现高效的特征提取。
- RepGFPN:利用高效的重参数梯度特征金字塔网络(GFPN)进行特征融合。
- ZeroHead:轻量级检测头,旨在减少计算开销。
- AlignedOTA:在训练过程中执行对齐最佳传输分配 (OTA),以改进标签分配。
- 蒸馏增强:采用知识蒸馏技术来提高性能。
性能指标
YOLO 提供各种型号(微型、小型、中型、大型),以满足不同的计算需求。主要性能指标包括
- mAP:在 COCO 等数据集上实现具有竞争力的平均精度 (mAP)。
- 推理速度快:专为快速推理而设计,适用于实时目标检测任务。
- 型号尺寸:提供不同尺寸,可灵活部署。
优势和劣势
优势:
- 高精度和高速度:兼顾精度和高效推理速度。
- 创新架构:采用 NAS 和高效组件,优化性能。
- 适应性强:提供不同尺寸的型号,满足不同的应用需求。
弱点
- 复杂性:与简单的模型相比,先进的架构在定制或修改时可能会更加复杂。
- 文档有限:与YOLO 系列(GitHub README)等更广泛采用的模型相比,文档可能较少。
使用案例
YOLO 非常适合需要兼顾精度和速度的应用,例如
- 实时监控:安全系统和监控,及时发现至关重要。
- 机器人学:要求高效、准确感知的机器人应用。
- 工业检测:制造业的自动化质量控制流程。
YOLOv9
YOLOv9是YOLO 系列的最新成果,由台湾中央研究院信息科学研究所的研究人员于 2024 年 2 月(arXiv)推出。YOLOv9 着重解决深度网络中的信息丢失问题,以提高准确性和效率。
建筑与特色
YOLOv9 引入了创新技术,以克服深度学习模型的局限性:
- 可编程梯度信息 (PGI):这是一项关键创新,可在整个网络中保存关键信息,减少信息丢失。
- 通用高效层聚合网络(GELAN):利用 GELAN 实现高效计算和参数利用。
- 主干和探测头改进:改进主干网和检测头,提高特征提取和检测能力。
性能指标
YOLOv9 展示了最先进的实时物体检测性能:
- mAP:在 COCO 等基准数据集上获得较高的 mAP 分数,优于之前的模型。
- 推理速度:推理速度惊人,适合实时应用。
- 模型大小:提供不同的模型尺寸(微小、小型、中型等),参数数量和 FLOPs 也各不相同。
优势和劣势
优势:
- 最先进的精度:与许多实时物体检测器相比,精度更高。
- 高效设计:PGI 和 GELAN 有助于提高效率和减少计算开销。
- 多功能性:可适应各种目标检测任务和部署方案。
- Ultralytics 集成:借助Ultralytics Python 软件包和全面的文档,使用方便。
弱点
- 新模式:作为一种较新的模式,与更成熟的模式相比,社区支持和可用资源可能仍在增长。
- 计算需求:较大的 YOLOv9 模型仍然需要大量的计算资源。
使用案例
YOLOv9 是要求顶级精度和实时处理的应用的理想选择:
- 高级驾驶辅助系统(ADAS):自动驾驶汽车和自主系统需要精确的目标检测。
- 高分辨率图像分析:受益于高分辨率图像中详细而准确的检测的应用,如卫星图像分析。
- 工业自动化:要求高精度和高可靠性的复杂自动化任务。
型号对照表
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLO 和 YOLOv9 都是物体检测领域的重大进步。YOLO 通过其高效的架构在速度和准确性之间取得了很好的平衡,而 YOLOv9 则通过其创新的 PGI 和 GELAN 技术推动了准确性的发展。您的选择将取决于您应用的具体需求,是优先考虑最先进的精度,还是优先考虑全面的性能配置。
用户可能还有兴趣将这些型号与其他YOLO 型号进行比较,例如 YOLOv8、YOLOv7、 YOLOv5和 YOLO11以及YOLOX 等型号、 RT-DETR和PP-YOLOE等模型,以进一步探索物体检测模型。
📅创建于 1 年前
✏️已更新 1 个月前