跳至内容

YOLOv9 与 YOLOv10:详细技术比较

Ultralytics 致力于推动计算机视觉技术的发展,其中一个重要部分就是开发和完善我们的YOLO 模型。本页将对YOLOv9YOLOv10 这两种最先进的物体检测模型进行详细的技术比较。我们将深入探讨它们在架构上的细微差别、性能基准和合适的应用,以帮助您为特定的计算机视觉任务选择最佳模型。

YOLOv9:可编程渐变信息

YOLOv9 于 2024 年 2 月由台湾中央研究院信息科学研究所的王建尧(Chien-Yao Wang)和廖鸿源(Hong-Yuan Mark Liao)推出,是高效物体检测领域的重大进步。YOLOv9 的核心创新在于其可编程梯度信息(PGI),旨在解决深度学习过程中的信息丢失问题。这是通过广义高效层聚合网络(GELAN)等技术实现的,可确保模型准确学习到您希望它学习的内容。

架构和主要功能: YOLOv9 利用 GELAN 加强特征提取,并在整个网络中保持信息的完整性。这种方法所建立的模型不仅准确,而且参数效率高,因此适用于计算资源有限的部署环境。YOLOv9 是根据论文《YOLOv9:利用可编程梯度信息学习你想学的东西》实现的。

性能指标: YOLOv9 在 COCO 数据集上的表现令人印象深刻。例如,YOLOv9c 在使用 25.3M 个参数和 102.1B FLOPs 的情况下,mAPval50-95 达到 53.0%。该模型的架构设计旨在提高效率,与以前的模型相比,它能以更少的参数和计算量达到更高的精度。

优势:

  • 高精度:实现最先进的物体检测精度。
  • 参数效率:借助 GELAN 和 PGI,有效利用参数和计算。
  • 新颖的方法:引入可编程梯度信息,提高学习效果。

弱点

  • 相对较新:作为一种较新的模式,与较成熟的模式相比,它的社区规模可能较小,部署实例也较少。

使用案例: YOLOv9 非常适合需要高精度和高效率的应用,例如

  • 高级机器人学:复杂机器人系统中的物体探测
  • 高分辨率图像分析:需要对大型图像进行详细分析的场景。
  • 资源受限环境:计算能力有限的边缘设备和移动应用。

了解有关 YOLOv9 的更多信息

作者和资源:

YOLOv10:效率-精度驱动的整体设计

YOLOv10 由清华大学的王敖、陈辉、刘力豪等人于 2024 年 5 月发布,专为实时端到端物体检测而设计,强调最高效率和最快速度。YOLOv10 引入了几项关键的方法改进,以提高准确性和效率,包括用于无 NMS 训练的一致双分配和效率-准确性驱动的整体模型设计

架构和主要功能: YOLOv10 的架构经过精心设计,最大限度地减少了计算冗余,并最大限度地提高了性能。主要的效率提升包括轻量级分类头空间信道去耦下采样等级引导块设计。通过大核卷积部分自注意(PSA)提高了准确性。这些创新使 YOLOv10 在不牺牲精度的情况下实现了最先进的速度和效率。YOLOv10在论文"YOLOv10:实时端到端目标检测"中作了详细介绍。

性能指标: YOLOv10 树立了实时目标检测的新基准。例如,在 COCO 数据集上,YOLOv10-S 的速度是RT-DETR 的 1.8 倍,而 AP 的速度则相当。与 YOLOv9-C 相比,YOLOv10-B 的延迟减少了 46%,参数减少了 25%,同时保持了类似的性能水平。YOLOv10-N 在 T4GPU 上的延迟仅为 1.84 毫秒,令人印象深刻。

优势:

  • 极高的效率:经过优化,可将延迟和计算成本降至最低。
  • 无 NMS 训练:一致的双分配实现了端到端的部署,无需非最大抑制,从而缩短了推理时间。
  • 高速:与之前的YOLO 版本和其他模型相比,推理速度明显加快。
  • 良好的准确性:保持有竞争力的准确性,同时优先考虑效率。

弱点

  • 最新模式:作为一种非常新的模式,它仍在积极开发之中,社区的支持也在不断增加。

使用案例: YOLOv10 非常适合实时性能和效率至关重要的应用:

  • 边缘计算:在资源有限的边缘设备上部署。
  • 实时视频分析:需要即时检测视频流中物体的应用。
  • 移动和嵌入式系统:集成到移动应用程序和嵌入式系统中,速度和功耗至关重要。

了解有关 YOLOv10 的更多信息

作者和资源:

对照表

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

结论

YOLOv9 和 YOLOv10 都代表了物体检测领域的尖端技术,各自具有独特的优势。YOLOv9 通过其可编程梯度信息,在精确度和参数效率方面表现出色,适用于复杂和详细的分析。而 YOLOv10 则以速度和实时性能为优先,采用效率-精度驱动的整体设计和无 NMS 培训,是边缘和实时应用的理想之选。

适合追求成熟与多功能平衡的用户、 Ultralytics YOLOv8仍然是一个可靠的选择。对于那些对最新进展和最高精确度感兴趣的用户来说,Ultralytics YOLOv8 是一个不错的选择、 Ultralytics YOLO11也是一个令人信服的选择,它继承了以往YOLO 迭代的优点。最终,最佳模型取决于您项目的具体要求,同时还要兼顾精度、速度和资源限制。

📅创建于 1 年前 ✏️已更新 1 个月前

评论