跳转至内容

YOLO11 vs YOLOv7:详细技术对比

选择最佳目标检测模型需要了解不同架构的特定功能和权衡。本页提供了 Ultralytics YOLO11 和 YOLOv7 这两个 YOLO 系列中的强大模型之间的技术比较。我们将深入研究它们的架构差异、性能基准和理想用例,以帮助您为您的计算机视觉项目选择最合适的模型。虽然 YOLOv7 是实时检测方面的一个重大进步,但 Ultralytics YOLO11 代表了当前最先进的技术,它提供了卓越的性能、更大的多功能性和更简化的开发者体验。

YOLOv7:高效准确的目标检测

YOLOv7 作为实时对象检测领域的一项重大进步而推出,专注于优化训练效率和准确性,且不增加推理成本。

架构和主要特性

YOLOv7 在之前的 YOLO 架构的基础上,引入了几项关键创新。它采用了诸如扩展高效层聚合网络 (E-ELAN) 和针对基于连接的模型的优化模型缩放方法等技术。“可训练的免费技巧包”是一个重要的贡献,它涉及在训练期间应用优化策略(如辅助头和由粗到细的指导),以提高最终模型精度,而不会在推理期间增加计算开销。YOLOv7 主要侧重于目标检测,但具有用于姿势估计等任务的社区扩展。

性能指标和用例

YOLOv7 在发布时,展示了最先进的性能,在速度和准确性之间实现了引人注目的平衡。例如,YOLOv7x 模型在 640 图像尺寸的 MS COCO 数据集上实现了 53.1% 的 mAPtest。它的效率使其适用于需要快速、准确检测的实时应用,如高级安全系统和自动驾驶系统。

优势

  • 高精度和速度平衡: 为实时任务提供了强大的 mAP 和推理速度组合。
  • 高效训练: 利用先进的训练技术(“免费赠品”)来提高准确性,而不会增加推理成本。
  • 成熟的性能:MS COCO 等标准基准测试中,已经证明了其结果。

弱点

  • 复杂性: 架构和训练技术可能很复杂,难以完全掌握和优化。
  • 资源密集型: 较大的YOLOv7模型需要大量的GPU资源来进行训练。
  • 任务多功能性有限: 主要侧重于目标检测,与其他任务(如分割或分类)需要单独实现,而像 YOLO11 这样的集成模型则不需要。
  • 碎片化的生态系统: 缺乏 Ultralytics 生态系统中发现的统一框架、广泛的文档和积极的维护。

了解更多关于 YOLOv7 的信息

Ultralytics YOLO11:最先进的效率和通用性

Ultralytics YOLO11Ultralytics的Glenn Jocher和Jing Qiu撰写,代表了YOLO系列中的最新演进。它于2024年9月27日发布,专为在用户友好的框架内实现卓越的准确性、更高的效率和更广泛的任务多功能性而设计。

架构和主要特性

YOLO11 的架构融合了先进的特征提取技术和精简的网络设计,与 YOLOv8 和 YOLOv7 等前代模型相比,通常能实现更高的精度,同时减少参数数量。这种优化带来了更快的推理速度和更低的计算需求,这对于在从 边缘设备 到云基础设施的各种平台上部署至关重要。

YOLO11 的一个关键优势是其多功能性。它是一个多任务模型,原生支持目标检测实例分割图像分类姿势估计和旋转框检测 (OBB)。它无缝集成到 Ultralytics 生态系统中,通过简单的 PythonCLI 界面、广泛的文档以及随时可用的预训练权重,提供简化的用户体验,从而实现高效训练

优势

  • 顶尖性能: 以更高效的架构实现了更高的 mAP 分数。
  • 卓越的效率: 在 CPU 和 GPU 上均具有出色的速度,与 YOLOv7 相比,在相当的精度下,参数和 FLOP 明显更少。
  • 无与伦比的多功能性: 在单个统一框架中原生支持检测、分割、分类、姿势估计和 OBB。
  • 易用性: 具有简单的 API、全面的文档,并与 Ultralytics HUB 等工具无缝集成,可实现无代码训练和部署。
  • 完善的生态系统: 受益于积极的开发、强大的社区、频繁的更新和丰富的资源。
  • 内存效率: 专为在训练和推理期间降低内存使用率而设计,使其比其他架构更易于访问。

弱点

  • 作为一个较新的模型,与较旧、更成熟的模型相比,某些小众的第三方工具集成可能仍在开发中。
  • 最大的模型虽然非常准确,但仍然可能需要大量的计算资源来进行训练和部署。

了解更多关于 YOLO11 的信息

性能正面交锋:YOLO11 vs. YOLOv7

在直接比较性能指标时,Ultralytics YOLO11 的优势变得显而易见。这些模型在整体上实现了准确性和效率之间的更好权衡。

模型 尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

从表中,可以得出几个关键的见解:

  • 准确性和效率: YOLO11l 实现了比 YOLOv7x (53.1) 更高的 mAP (53.4),同时使用的参数 (25.3M vs. 71.3M) 和 FLOPs (86.9B vs. 189.9B) 大幅减少。
  • 推理速度: YOLO11模型速度明显更快,尤其是在使用TensorRT的 GPU 上。在 T4 GPU 上,YOLO11l 的速度几乎是 YOLOv7x 的两倍。此外,YOLO11 通过 ONNX 提供强大的 CPU 性能基准,这对于许多无法获得 YOLOv7 数据的实际部署至关重要。
  • 可扩展性: YOLO11 系列提供更广泛、更高效的模型范围,从轻量级的 YOLO11n(1.5 毫秒延迟)到高精度的 YOLO11x(54.7 mAP),使开发人员能够根据其特定需求找到完美的平衡。

为什么选择 Ultralytics YOLO11?

虽然 YOLOv7 在当时是一个强大的模型,但 Ultralytics YOLO11 是现代计算机视觉项目的明确选择。它不仅在准确性和速度等核心指标上超越了 YOLOv7,而且还提供了卓越的用户体验和更全面的功能集。

选择 YOLO11 的主要优势包括:

  • 统一框架: 一个简单易用的软件包,适用于多个视觉任务,无需管理不同的存储库和环境。
  • 积极开发和支持: 作为积极维护的 Ultralytics 生态系统的一部分,YOLO11 持续接收来自大型社区和核心开发团队的更新、错误修复和支持。
  • 可用于生产: YOLO11 专注于效率、易于部署和强大的工具,专为实际应用而构建,从 原型设计 到大规模生产。
  • 面向未来: 通过采用 YOLO11,开发者可以与对象检测研究的前沿保持一致,并从 Ultralytics 的持续创新中受益。

对于寻求由强大的生态系统支持的现代、通用和高性能模型的开发者来说,Ultralytics YOLO11 是明确的选择。

其他模型对比

为了进一步探索,请考虑以下涉及YOLOv7、YOLO11和其他相关模型的比较:



📅 1 年前创建 ✏️ 1 个月前更新

评论