YOLOv10 与 YOLOv7:详细比较
选择正确的物体检测模型对于计算机视觉项目至关重要。Ultralytics YOLO 可根据不同需求提供一系列模型。本页将对 YOLOv10 和 YOLOv7 这两种常用的对象检测任务进行技术比较。我们将分析它们的架构、性能指标和理想应用,帮助您做出明智的决定。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
清华大学研究人员于 2024 年 5 月推出的 YOLOv10 代表了实时物体检测的最前沿。在他们的 Arxiv 论文《YOLOv10:实时端到端物体检测》中,王敖、陈辉、刘力豪等人详细介绍了 YOLOv10,认为它在效率和准确性方面都取得了重大进步。正式实现可在GitHub 上获取。YOLOv10 专为端到端部署而设计,解决了以往YOLO 版本依赖非最大抑制(NMS)的问题。
建筑和主要特点
YOLOv10 在架构上进行了多项创新,旨在提高速度和减少计算冗余。主要特点包括无锚方法和无 NMS 设计,从而简化了后处理并加快了推理速度。该模型采用了以效率和精度为导向的整体设计策略,优化了各种组件,以实现最小的开销和最大的能力。因此,该模型不仅速度更快,而且精度也很有竞争力,适用于边缘设备和实时应用。
性能指标和基准:
如比较表所示,YOLOv10 模型,尤其是 YOLOv10n 和 YOLOv10s 变体,在TensorRT 上的推理速度令人印象深刻,分别达到 1.56ms 和 2.66ms。YOLOv10n 仅用 2.3M 个参数和 6.7B FLOPs 就实现了 39.5 的 mAPval50-95,而 YOLOv10x 则达到了 54.4 mAPval50-95。这些指标凸显了 YOLOv10 利用优化的计算资源提供最先进性能的能力。要深入了解YOLO 性能指标,请参阅有关YOLO 性能指标的Ultralytics 文档。
使用案例:
YOLOv10 强调实时性能和效率,非常适合需要在计算资源有限的情况下快速检测物体的应用。适用的应用案例包括
- 边缘人工智能应用:部署在边缘设备上,用于在智能摄像头和物联网设备等场景中进行实时处理。
- 机器人学:如人工智能在机器人技术中的作用所述,在机器人系统的导航和交互中实现更快、更高效的物体识别。
- 自主系统:应用于自动驾驶汽车和无人机,低延迟对安全有效地运行至关重要。
- 移动和嵌入式系统:在计算能力有限的移动应用和嵌入式系统中进行物体检测。
优势:
- 高效率:无 NMS 设计和优化架构可加快推理速度并减少延迟。
- 具有竞争力的精确度:在大幅提高速度的同时,保持极高的精确度。
- 端到端部署:专为端到端无缝实时目标检测而设计。
- 更小的模型尺寸:与某些前代产品相比,高效的架构可缩小模型尺寸,减少参数数量。
弱点
- 相对较新:作为一种较新的模式,YOLOv10 与 YOLOv7 等更成熟的模式相比,社区规模可能较小,部署实例也较少。
- 性能调整:要达到最佳性能,可能需要对不同的模型大小和配置进行微调和实验,详情请参阅模型训练提示。
YOLOv7
YOLOv7 由 Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao 于 2022 年 7 月推出,是一个备受赞誉的物体检测模型,以高效和准确著称。该模型在 Arxiv 论文《YOLOv7:可训练的自由包为实时物体检测器设定了新的最先进水平》中有详细介绍,官方 GitHub 存储库提供了实现细节。YOLOv7以之前的YOLO 版本为基础,在架构上进行了改进,在不大幅增加计算成本的情况下最大限度地提高了性能。
建筑和主要特点
YOLOv7 在结构上进行了多项创新,以提高其性能和效率。主要特点包括
- 扩展高效层聚合网络(E-ELAN):增强网络的学习能力和梯度流。
- 基于串联模型的模型缩放:为有效的深度和宽度缩放提供指导。
- 辅助头和粗-细导线头:提高训练效率和检测精度。
这些功能使 YOLOv7 能够在速度和准确性方面达到最先进的结果,使其成为各种物体检测任务的可靠选择。
性能指标和基准:
YOLOv7 在速度和准确性之间取得了很好的平衡。如表所示,YOLOv7l 的 mAPval50-95 为 51.4,而 YOLOv7x 的 mAPval50-95 为 53.1。虽然 YOLOv7 模型的TensorRT 推理速度略低于 YOLOv10n 和 YOLOv10s,但其性能仍然具有竞争力,尤其是在考虑到 YOLOv7 模型规模较大的情况下。有关详细指标,请参阅YOLOv7 文档。
使用案例:
YOLOv7 兼顾精度和效率,适用于需要在实时场景中进行可靠物体检测的应用。理想的使用案例包括
- 自动驾驶汽车:在复杂的驾驶环境中进行可靠的物体检测,这对自动驾驶汽车的人工智能至关重要。
- 先进的监控系统:高精度识别安全系统中潜在的安全威胁。
- 机器人:用于机器人操纵和导航的精确物体识别,类似于 YOLOv10,但在某些情况下可能会更精确。
- 工业自动化:在精度要求极高的生产过程中进行质量控制和缺陷检测。
优势:
- 高 mAP:平均精确度高: 平均精确度高,表明物体检测精度极佳。
- 高效推理:专为快速推理而设计,适合实时应用。
- 成熟完善:YOLOv7 受益于更大的社区和广泛的使用,提供了更多的资源和支持。
- 易于管理的模型尺寸:在模型尺寸和性能之间实现了良好的平衡。
弱点
- 复杂性:该架构比一些简单的模型更为复杂,可能需要更多的专业知识来进行微调和优化。
- 与纳米模型相比资源密集:虽然效率很高,但与 YOLOv10n 等较小的模型相比,它的计算量更大,尤其是在资源极其有限的环境中。
其他YOLO 型号
除 YOLOv10 和 YOLOv7 外,Ultralytics 还提供一系列YOLO 模型,每种模型都具有独特的优势。考虑探索 YOLOv8是一个多功能和用户友好的选择,YOLOv9是网络架构的进步,而 YOLO11以获得最先进的性能。您还可以将 YOLOv7 与其他型号进行比较,如 YOLOv5和YOLOX进行比较,以了解它们之间的具体权衡。