YOLOv9:深度技术对比
计算机视觉与实时目标检测领域在过去几年取得了显著进展。在成熟可靠的模型与新型研究架构之间做出选择,是机器学习工程师面临的普遍挑战。YOLO 指南对YOLO 两个极具影响力的模型——YOLOv4和YOLOv5——进行了全面的技术对比: YOLOv5 与 YOLOv9。
无论您是在资源受限的边缘设备上部署模型,研究高保真特征提取,还是构建复杂的物体检测管道,理解这些模型的架构细节、性能指标及生态系统差异都至关重要。
模型概述
在深入探讨架构比较之前,了解每种模型的起源和主要目标会有所帮助。
Ultralytics YOLOv5
由格伦·乔克开发,Ultralytics公司发布 Ultralytics 于2020年6月2YOLOv5 开发者与视觉模型交互方式的范式转变。通过全面采用 PyTorch 框架YOLOv5 早期基于Darknet模型的复杂编译步骤,转而提供直观的Python用户体验。
- 作者: Glenn Jocher
- 组织:Ultralytics
- 日期: 2020-06-26
- GitHub:YOLOv5 仓库
- 文档:YOLOv5 概述
YOLOv5 以其易用性和在多样化硬件环境中的稳定性能YOLOv5 它不仅支持目标检测,还支持图像分类和实例分割。
YOLOv9
由台湾中央研究院资讯科学研究所的王建耀与廖宏远共同提出YOLOv9 重点YOLOv9 于架构理论,旨在缓解深度神经网络中的信息瓶颈问题。
- 作者: Chien-Yao Wang 和 Hong-Yuan Mark Liao
- 组织: 台湾中研院资讯所
- 日期: 2024-02-21
- Arxiv:2402.13616
- GitHub:YOLOv9 仓库
- 文档:YOLOv9 文档
YOLOv9 的核心YOLOv9 两大理论创新:可编程梯度信息(PGI)与广义高效层聚合网络(GELAN)。这些概念有助于模型在深度网络层中保留关键的空间特征。
让您的部署具备未来适应性
YOLOv5 YOLOv9 但新发布的YOLO26实现了速度与精度的终极平衡。凭借端到端NMS设计和最高提升43%CPU ,YOLO26特别推荐用于现代边缘计算和生产部署场景。
建筑与技术差异
理解驱动这些视觉模型运行的核心机制,对于优化模型部署策略至关重要。
特征提取与信息保留
YOLOv5 交叉阶段部分网络(CSPNet)YOLOv5 骨干架构,在保持反向传播过程中梯度流准确性的同时,有效降低了计算开销。该设计针对传统GPU 进行了高度优化,相较于复杂的transformer ,在训练过程中能显著降低内存需求。
YOLOv9 通用架构GELAN,该架构在CSPNet原理基础上进行了扩展。结合辅助可逆分支PGIYOLOv9 深度层不会丢失实现精确目标函数所需的语义数据。这YOLOv9 达到高精度,尤其在小目标识别方面表现突出,但复杂的辅助分支有时会增加向深度受限边缘硬件导出管道的复杂性。
内存要求与训练效率
在训练效率方面YOLOv5 极其强劲。经过精心维护Ultralytics 确保YOLOv5 消耗CUDA 显著减少,使研究人员能够在消费级GPU上最大化批量大小。YOLOv9 出色的参数效率(相对于其规模而言具有高精度),但若未使用优化框架,其训练过程可能更耗费资源。 值得庆幸的是,YOLOv9 Ultralytics 其资源管理效率已显著接近YOLOv5的精简水平。
性能与指标
为客观评估这些架构,我们COCO标准数据集对其性能进行对比。下文详细列出了各项指标的具体数据,mAP 平均精度均值)、推理速度及参数数量等。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
如表所示,在同等性能层级下YOLOv9 凭借其更新的架构YOLOv9 更高的原始准确率。然而,YOLOv5n仍保持着1.12毫秒的极低TensorRT ,彰显其在高速局部化边缘计算应用中的持久优势。
训练方法与易用性
当今计算机视觉技术的真正优势在于其工具链的易用性。
Ultralytics 优势
YOLOv9 模型的原始研究仓库YOLOv9 基础,但它们通常伴随着复杂的依赖矩阵和冗余脚本。Ultralytics Python 完全抽象了这种复杂性。Ultralytics ,您可以YOLOv9 完全一致的统一语法YOLOv9 训练、评估和导出YOLOv9 。
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")
# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")
# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX
model_v9.export(format="onnx")
这种单API方案具备强大的多功能性,不仅支持检测功能,还能根据所选模型姿势估计 定向边界框(旋转框检测)。此外,它Comet Biases等工具的集成也十分稳健。 Weights & Biases 等工具的稳健集成已直接内置于训练流程中。
理想使用场景与实际应用
在这些架构之间进行选择,很大程度上取决于硬件的限制条件以及应用领域所需的精度要求。
何时选择 YOLOv5
YOLOv5 久经沙场的资深选手,在注重稳定性、低内存占用及极致导出兼容性的部署场景中表现卓越。
- 移动端部署:将YOLOv5导出YOLOv5 TFLiteCoreML 设备端推理的过程极其顺畅。
- 传统边缘硬件:对于树莓派或早期NVIDIA Nano等设备,YOLOv5 的简洁卷积结构YOLOv5 智能停车管理等应用保持稳定帧率。
- 快速原型制作:社区教程的广泛可用性、定制预训练权重以及海量数据集的兼容性,使其成为验证概念验证最快捷的方式。
何时选择 YOLOv9
YOLOv9 特别YOLOv9 需要捕捉复杂细节并最大限度减少漏检的场景,即使这会带来稍高的计算开销。
- 航空与卫星影像:PGI框架在保持小目标精度方面表现卓越,使YOLOv9 无人机农业监测的YOLOv9 。
- 医学影像诊断:在检测高分辨率扫描中的微小异常或病变时,GELAN精准的梯度流技术为召回率提供了关键优势。
- 高端零售分析:在密集货架上追踪重叠商品YOLOv9卓越的特征保留能力能带来显著优势。
拓展视野
通过对比YOLOv5 YOLOv9 清晰地YOLOv9 架构从2020年到2024年的演进历程,而人工智能领域的发展速度正前所未有地加快。 对于追求性能极限的开发者,强烈推荐探索最新的YOLO26模型。该模型通过原生端到端NMS设计替代传统非最大抑制,并采用先进的MuSGD优化器,成功弥合了研究级精度与生产级速度的鸿沟。 通过移除DFL(分布式焦点损失,以简化导出流程并提升边缘/低功耗设备兼容性),YOLO26实现 CPU 提升高达43%,成为边缘计算的理想选择。此外,ProgLoss + STAL组合优化了损失函数,显著提升小目标识别能力——这对物联网、机器人及航空影像领域至关重要。
您可能还想将这些架构与其他尖端模型进行比较,例如 RT-DETR 或功能强大的 YOLO11。采用统一Ultralytics 无论选择何种模型,都能确保开发流程保持简洁高效,随时可扩展。