YOLOv7 vs YOLO11:详细技术对比
选择最佳目标检测模型需要深入了解不同架构的特定功能和权衡。本页提供了 YOLOv7 和 Ultralytics YOLO11 这两个 YOLO 系列中的强大模型之间的全面技术比较。我们将深入研究它们的架构差异、性能基准和理想用例,以帮助您为您的 计算机视觉 项目选择最合适的模型。
YOLOv7:高效准确的目标检测
YOLOv7的推出是实时目标检测领域的一项重大进步,专注于优化训练效率和准确性,同时不增加推理成本。它在发布时为实时检测器树立了新的技术水平标杆。
作者: Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao
组织: 台湾中研院资讯科学研究所
日期: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
文档: https://docs.ultralytics.com/models/yolov7/
架构和主要特性
YOLOv7 在之前的 YOLO 架构的基础上引入了几项关键创新。它在 backbone 中采用了诸如扩展高效层聚合网络 (E-ELAN) 等技术,以改进特征提取和学习。一个主要的贡献是“可训练的免费技巧包”的概念,它涉及在训练期间应用优化策略(例如使用辅助检测头和由粗到精的指导)以提高最终模型精度,而不会在推理期间增加计算开销。虽然主要专注于目标检测,但官方存储库显示了社区对诸如姿势估计和实例分割等任务的扩展。
性能和用例
YOLOv7 在发布时展示了最先进的性能,在速度和准确性之间实现了引人注目的平衡。例如,YOLOv7x 模型在 640 图像尺寸的 MS COCO 数据集 上实现了 53.1% 的 mAPtest。它的效率使其适用于实时应用,如高级 安全系统 和需要快速、准确检测的自主系统。
优势
- 高精度和速度平衡: 在 GPU 上为实时任务提供了强大的 mAP 和推理速度组合。
- 高效训练: 利用先进的训练技术(“免费赠品”)来提高准确性,而不会增加推理成本。
- 成熟的性能: 在 MS COCO 等标准基准测试中,已经证明了其结果。
弱点
- 复杂性: 架构和训练技术可能很复杂,难以完全掌握和优化。
- 资源密集型: 较大的YOLOv7模型需要大量的GPU资源来进行训练。
- 任务多功能性有限: 主要侧重于目标检测,与其他任务(如分割或分类)需要单独实现,而像 YOLO11 这样的集成模型则不需要。
- 维护较少: 该框架的开发或维护活跃度不如 Ultralytics 生态系统,导致更新较少,社区支持也较少。
Ultralytics YOLO11:最先进的效率和通用性
Ultralytics YOLO11代表了Ultralytics YOLO系列中的最新演进,专为在用户友好的框架内实现卓越的准确性、更高的效率和更广泛的任务多功能性而设计。它建立在YOLOv8等前代产品的成功基础上,以提供最先进的体验。
作者: Glenn Jocher 和 Jing Qiu
机构: Ultralytics
日期: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 的架构融合了先进的特征提取技术和精简的网络设计,与前代模型相比,通常能实现更高的精度,同时减少参数数量。这种优化带来了更快的推理速度和更低的计算需求,这对于在从 边缘设备 到云基础设施的各种平台上部署至关重要。
YOLO11 的一个关键优势是其通用性。它原生支持多种计算机视觉任务,包括目标检测、实例分割、图像分类、姿势估计和旋转框检测 (OBB)。它无缝集成到 Ultralytics 生态系统中,通过简单的 Python 和 CLI 界面、广泛的文档以及随时可用的预训练权重,提供简化的用户体验,从而实现高效训练。
性能和用例
YOLO11 在不同的模型尺寸上展示了令人印象深刻的 平均精度均值 (mAP) 分数,在 速度和准确性之间实现了良好的权衡。例如,YOLO11m 在 640 图像尺寸下实现了 51.5 的 mAPval,其参数明显少于 YOLOv7l。YOLO11n 等较小的变体提供极快的推理速度,而 YOLO11x 等较大的模型则最大限度地提高了准确性。值得注意的是,与其他架构相比,YOLO11 模型通常在训练和推理期间表现出 更低的内存使用率。
YOLO11 增强的精度和效率使其成为需要精确、实时处理的应用程序的理想选择:
- 机器人技术:实现精确的导航和物体交互,如人工智能在机器人领域中的作用中所探讨的那样。
- 安全系统: 为先进的安全警报系统提供入侵检测功能。
- 零售分析:改进库存管理和客户行为分析。
- 工业自动化:支持制造业中的质量控制。
优势
- 顶尖性能: 高 mAP 分数,具有优化的、无锚框架构。
- 高效推理: 速度极佳,尤其是在 CPU 上,适合实时需求。
- 通用的任务支持: 在单个框架中原生处理检测、分割、分类、姿势估计和 OBB。
- 易用性: 简单的 API、广泛的文档以及集成的 Ultralytics HUB 支持,可实现无代码训练和部署。
- 维护良好的生态系统: 积极的开发、强大的社区、频繁的更新和高效的训练过程。
- 可扩展性: 能够在从边缘到云端的各种硬件上高效运行,且内存需求较低。
弱点
- 作为一个较新的模型,与较旧、更成熟的模型相比,某些特定的第三方工具集成可能仍在发展中。
- 较大的模型在训练时可能需要大量的计算资源,但对于其性能级别而言,它们仍然非常高效。
性能对比:YOLOv7 vs. YOLO11
下表详细比较了 COCO 数据集上 YOLOv7 和 YOLO11 模型的性能。YOLO11 模型在准确性、速度和效率方面表现出卓越的平衡性。例如,YOLO11l 实现了比 YOLOv7x 更高的 mAP,但参数和 FLOP 却不到后者的一半,并且在 GPU 上速度明显更快。同样,YOLO11m 在参数和计算成本约为一半的情况下,与 YOLOv7l 的准确性相匹配。最小的模型 YOLO11n 在 CPU 和 GPU 上都提供了非凡的速度,且资源使用量极少,使其成为边缘应用的理想选择。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
结论:您应该选择哪种模型?
虽然 YOLOv7 在当时是一个强大的模型,并且仍然为实时对象检测提供强大的性能,但 Ultralytics YOLO11 代表着一个巨大的飞跃。YOLO11 不仅在关键性能指标上超越了 YOLOv7,而且还提供了一个更加通用、用户友好且支持良好的框架。
对于正在寻找现代化的、一体化解决方案的开发人员和研究人员来说,YOLO11 是明确的选择。它的优势包括:
- 卓越的性能平衡: YOLO11 在精度、速度和计算成本之间提供了更好的权衡。
- 多任务通用性: 对检测、分割、分类、姿势估计和 OBB 的原生支持消除了对多个模型的需求,并简化了开发工作流程。
- 易用性: 简化的 API、全面的文档和简单的训练程序使初学者和专家都可以访问它。
- 积极开发: 作为 Ultralytics 生态系统的一部分,YOLO11 受益于持续的更新、强大的开源社区以及与 Ultralytics HUB 等工具的集成,从而实现无缝的 MLOps。
总而言之,如果您的首要任务是利用 AI 的最新进展来满足广泛的应用需求,并侧重于易于部署和面向未来,那么建议使用 Ultralytics YOLO11 模型。
探索其他模型
为了进一步探索,请考虑以下涉及YOLOv7、YOLO11和Ultralytics文档中其他相关模型的比较:
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv10
- YOLOv7 与 YOLOv8 对比
- YOLOv7 与 YOLOv5 对比
- 探索像 YOLOv9 和 YOLOv10 这样的最新模型。