跳转至内容

YOLOv7 vs YOLO11:详细技术对比

选择最佳目标检测模型需要深入了解不同架构的特定功能和权衡。本页提供了 YOLOv7 和 Ultralytics YOLO11 这两个 YOLO 系列中的强大模型之间的全面技术比较。我们将深入研究它们的架构差异、性能基准和理想用例,以帮助您为您的 计算机视觉 项目选择最合适的模型。

YOLOv7:高效准确的目标检测

YOLOv7的推出是实时目标检测领域的一项重大进步,专注于优化训练效率和准确性,同时不增加推理成本。它在发布时为实时检测器树立了新的技术水平标杆。

作者: Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao
组织: 台湾中研院资讯科学研究所
日期: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
文档: https://docs.ultralytics.com/models/yolov7/

架构和主要特性

YOLOv7 在之前的 YOLO 架构的基础上引入了几项关键创新。它在 backbone 中采用了诸如扩展高效层聚合网络 (E-ELAN) 等技术,以改进特征提取和学习。一个主要的贡献是“可训练的免费技巧包”的概念,它涉及在训练期间应用优化策略(例如使用辅助检测头和由粗到精的指导)以提高最终模型精度,而不会在推理期间增加计算开销。虽然主要专注于目标检测,但官方存储库显示了社区对诸如姿势估计实例分割等任务的扩展。

性能和用例

YOLOv7 在发布时展示了最先进的性能,在速度和准确性之间实现了引人注目的平衡。例如,YOLOv7x 模型在 640 图像尺寸的 MS COCO 数据集 上实现了 53.1% 的 mAPtest。它的效率使其适用于实时应用,如高级 安全系统 和需要快速、准确检测的自主系统。

优势

  • 高精度和速度平衡: 在 GPU 上为实时任务提供了强大的 mAP 和推理速度组合。
  • 高效训练: 利用先进的训练技术(“免费赠品”)来提高准确性,而不会增加推理成本。
  • 成熟的性能: 在 MS COCO 等标准基准测试中,已经证明了其结果。

弱点

  • 复杂性: 架构和训练技术可能很复杂,难以完全掌握和优化。
  • 资源密集型: 较大的YOLOv7模型需要大量的GPU资源来进行训练。
  • 任务多功能性有限: 主要侧重于目标检测,与其他任务(如分割或分类)需要单独实现,而像 YOLO11 这样的集成模型则不需要。
  • 维护较少: 该框架的开发或维护活跃度不如 Ultralytics 生态系统,导致更新较少,社区支持也较少。

了解更多关于 YOLOv7 的信息

Ultralytics YOLO11:最先进的效率和通用性

Ultralytics YOLO11代表了Ultralytics YOLO系列中的最新演进,专为在用户友好的框架内实现卓越的准确性、更高的效率和更广泛的任务多功能性而设计。它建立在YOLOv8等前代产品的成功基础上,以提供最先进的体验。

作者: Glenn Jocher 和 Jing Qiu
机构: Ultralytics
日期: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolo11/

架构和主要特性

YOLO11 的架构融合了先进的特征提取技术和精简的网络设计,与前代模型相比,通常能实现更高的精度,同时减少参数数量。这种优化带来了更快的推理速度和更低的计算需求,这对于在从 边缘设备 到云基础设施的各种平台上部署至关重要。

YOLO11 的一个关键优势是其通用性。它原生支持多种计算机视觉任务,包括目标检测实例分割图像分类姿势估计和旋转框检测 (OBB)。它无缝集成到 Ultralytics 生态系统中,通过简单的 PythonCLI 界面、广泛的文档以及随时可用的预训练权重,提供简化的用户体验,从而实现高效训练

性能和用例

YOLO11 在不同的模型尺寸上展示了令人印象深刻的 平均精度均值 (mAP) 分数,在 速度和准确性之间实现了良好的权衡。例如,YOLO11m 在 640 图像尺寸下实现了 51.5 的 mAPval,其参数明显少于 YOLOv7l。YOLO11n 等较小的变体提供极快的推理速度,而 YOLO11x 等较大的模型则最大限度地提高了准确性。值得注意的是,与其他架构相比,YOLO11 模型通常在训练和推理期间表现出 更低的内存使用率

YOLO11 增强的精度和效率使其成为需要精确、实时处理的应用程序的理想选择:

优势

  • 顶尖性能: 高 mAP 分数,具有优化的、无锚框架构。
  • 高效推理: 速度极佳,尤其是在 CPU 上,适合实时需求。
  • 通用的任务支持: 在单个框架中原生处理检测、分割、分类、姿势估计和 OBB。
  • 易用性: 简单的 API、广泛的文档以及集成的 Ultralytics HUB 支持,可实现无代码训练和部署。
  • 维护良好的生态系统: 积极的开发、强大的社区、频繁的更新和高效的训练过程。
  • 可扩展性: 能够在从边缘到云端的各种硬件上高效运行,且内存需求较低。

弱点

  • 作为一个较新的模型,与较旧、更成熟的模型相比,某些特定的第三方工具集成可能仍在发展中。
  • 较大的模型在训练时可能需要大量的计算资源,但对于其性能级别而言,它们仍然非常高效。

了解更多关于 YOLO11 的信息

性能对比:YOLOv7 vs. YOLO11

下表详细比较了 COCO 数据集上 YOLOv7 和 YOLO11 模型的性能。YOLO11 模型在准确性、速度和效率方面表现出卓越的平衡性。例如,YOLO11l 实现了比 YOLOv7x 更高的 mAP,但参数和 FLOP 却不到后者的一半,并且在 GPU 上速度明显更快。同样,YOLO11m 在参数和计算成本约为一半的情况下,与 YOLOv7l 的准确性相匹配。最小的模型 YOLO11n 在 CPU 和 GPU 上都提供了非凡的速度,且资源使用量极少,使其成为边缘应用的理想选择。

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

结论:您应该选择哪种模型?

虽然 YOLOv7 在当时是一个强大的模型,并且仍然为实时对象检测提供强大的性能,但 Ultralytics YOLO11 代表着一个巨大的飞跃。YOLO11 不仅在关键性能指标上超越了 YOLOv7,而且还提供了一个更加通用、用户友好且支持良好的框架。

对于正在寻找现代化的、一体化解决方案的开发人员和研究人员来说,YOLO11 是明确的选择。它的优势包括:

  • 卓越的性能平衡: YOLO11 在精度、速度和计算成本之间提供了更好的权衡。
  • 多任务通用性: 对检测、分割、分类、姿势估计和 OBB 的原生支持消除了对多个模型的需求,并简化了开发工作流程。
  • 易用性: 简化的 API、全面的文档和简单的训练程序使初学者和专家都可以访问它。
  • 积极开发: 作为 Ultralytics 生态系统的一部分,YOLO11 受益于持续的更新、强大的开源社区以及与 Ultralytics HUB 等工具的集成,从而实现无缝的 MLOps

总而言之,如果您的首要任务是利用 AI 的最新进展来满足广泛的应用需求,并侧重于易于部署和面向未来,那么建议使用 Ultralytics YOLO11 模型。

探索其他模型

为了进一步探索,请考虑以下涉及YOLOv7、YOLO11和Ultralytics文档中其他相关模型的比较:



📅 1 年前创建 ✏️ 1 个月前更新

评论