YOLOv9 与 YOLOv10:详细技术比较
Ultralytics 致力于推动计算机视觉技术的发展,其中一个重要部分就是开发和完善我们的YOLO 模型。本页将对YOLOv9和YOLOv10 这两种最先进的物体检测模型进行详细的技术比较。我们将深入探讨它们在架构上的细微差别、性能基准和合适的应用,以帮助您为特定的计算机视觉任务选择最佳模型。
YOLOv9:可编程渐变信息
YOLOv9 于 2024 年 2 月由台湾中央研究院信息科学研究所的王建尧(Chien-Yao Wang)和廖鸿源(Hong-Yuan Mark Liao)推出,是高效物体检测领域的重大进步。YOLOv9 的核心创新在于其可编程梯度信息(PGI),旨在解决深度学习过程中的信息丢失问题。这是通过广义高效层聚合网络(GELAN)等技术实现的,可确保模型准确学习到您希望它学习的内容。
架构和主要功能: YOLOv9 利用 GELAN 加强特征提取,并在整个网络中保持信息的完整性。这种方法所建立的模型不仅准确,而且参数效率高,因此适用于计算资源有限的部署环境。YOLOv9 是根据论文《YOLOv9:利用可编程梯度信息学习你想学的东西》实现的。
性能指标: YOLOv9 在 COCO 数据集上的表现令人印象深刻。例如,YOLOv9c 在使用 25.3M 个参数和 102.1B FLOPs 的情况下,mAPval50-95 达到 53.0%。该模型的架构设计旨在提高效率,与以前的模型相比,它能以更少的参数和计算量达到更高的精度。
优势:
- 高精度:实现最先进的物体检测精度。
- 参数效率:借助 GELAN 和 PGI,有效利用参数和计算。
- 新颖的方法:引入可编程梯度信息,提高学习效果。
弱点
- 相对较新:作为一种较新的模式,与较成熟的模式相比,它的社区规模可能较小,部署实例也较少。
使用案例: YOLOv9 非常适合需要高精度和高效率的应用,例如
- 高级机器人学:复杂机器人系统中的物体探测
- 高分辨率图像分析:需要对大型图像进行详细分析的场景。
- 资源受限环境:计算能力有限的边缘设备和移动应用。
作者和资源:
- 作者: Chien-Yao Wang、Hong-Yuan Mark Liao王建尧、廖鸿源
- 组织机构台湾中央研究院资讯科学研究所
- 日期:2024-02-21
- Arxiv: arXiv:2402.13616
- GitHub: github.com/WongKinYiu/yolov9
- 文档: docsultralyticscom/models/yolov9/
YOLOv10:效率-精度驱动的整体设计
YOLOv10 由清华大学的王敖、陈辉、刘力豪等人于 2024 年 5 月发布,专为实时端到端物体检测而设计,强调最高效率和最快速度。YOLOv10 引入了几项关键的方法改进,以提高准确性和效率,包括用于无 NMS 训练的一致双分配和效率-准确性驱动的整体模型设计。
架构和主要功能: YOLOv10 的架构经过精心设计,最大限度地减少了计算冗余,并最大限度地提高了性能。主要的效率提升包括轻量级分类头、空间信道去耦下采样和等级引导块设计。通过大核卷积和部分自注意(PSA)提高了准确性。这些创新使 YOLOv10 在不牺牲精度的情况下实现了最先进的速度和效率。YOLOv10在论文"YOLOv10:实时端到端目标检测"中作了详细介绍。
性能指标: YOLOv10 树立了实时目标检测的新基准。例如,在 COCO 数据集上,YOLOv10-S 的速度是RT-DETR 的 1.8 倍,而 AP 的速度则相当。与 YOLOv9-C 相比,YOLOv10-B 的延迟减少了 46%,参数减少了 25%,同时保持了类似的性能水平。YOLOv10-N 在 T4GPU 上的延迟仅为 1.84 毫秒,令人印象深刻。
优势:
- 极高的效率:经过优化,可将延迟和计算成本降至最低。
- 无 NMS 训练:一致的双分配实现了端到端的部署,无需非最大抑制,从而缩短了推理时间。
- 高速:与之前的YOLO 版本和其他模型相比,推理速度明显加快。
- 良好的准确性:保持有竞争力的准确性,同时优先考虑效率。
弱点
- 最新模式:作为一种非常新的模式,它仍在积极开发之中,社区的支持也在不断增加。
使用案例: YOLOv10 非常适合实时性能和效率至关重要的应用:
- 边缘计算:在资源有限的边缘设备上部署。
- 实时视频分析:需要即时检测视频流中物体的应用。
- 移动和嵌入式系统:集成到移动应用程序和嵌入式系统中,速度和功耗至关重要。
作者和资源:
- 作者: Ao Wang, Hui Chen, Lihao Liu, et al:王傲、陈慧、刘力豪等
- 组织机构: 清华大学清华大学
- 日期:2024-05-23
- Arxiv: arXiv:2405.14458
- GitHub: github.com/THU-MIG/yolov10
- 文档: docsultralyticscom/models/yolov10/
对照表
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
结论
YOLOv9 和 YOLOv10 都代表了物体检测领域的尖端技术,各自具有独特的优势。YOLOv9 通过其可编程梯度信息,在精确度和参数效率方面表现出色,适用于复杂和详细的分析。而 YOLOv10 则以速度和实时性能为优先,采用效率-精度驱动的整体设计和无 NMS 培训,是边缘和实时应用的理想之选。
适合追求成熟与多功能平衡的用户、 Ultralytics YOLOv8仍然是一个可靠的选择。对于那些对最新进展和最高精确度感兴趣的用户来说,Ultralytics YOLOv8 是一个不错的选择、 Ultralytics YOLO11也是一个令人信服的选择,它继承了以往YOLO 迭代的优点。最终,最佳模型取决于您项目的具体要求,同时还要兼顾精度、速度和资源限制。