YOLO11 vs YOLOv7:详细技术对比
选择最佳目标检测模型需要了解不同架构的特定功能和权衡。本页提供了 Ultralytics YOLO11 和 YOLOv7 这两个 YOLO 系列中的强大模型之间的技术比较。我们将深入研究它们的架构差异、性能基准和理想用例,以帮助您为您的计算机视觉项目选择最合适的模型。虽然 YOLOv7 是实时检测方面的一个重大进步,但 Ultralytics YOLO11 代表了当前最先进的技术,它提供了卓越的性能、更大的多功能性和更简化的开发者体验。
YOLOv7:高效准确的目标检测
YOLOv7 作为实时对象检测领域的一项重大进步而推出,专注于优化训练效率和准确性,且不增加推理成本。
- 作者: Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao
- 组织: 台湾中研院资讯所
- 日期: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- 文档: https://docs.ultralytics.com/models/yolov7/
架构和主要特性
YOLOv7 在之前的 YOLO 架构的基础上,引入了几项关键创新。它采用了诸如扩展高效层聚合网络 (E-ELAN) 和针对基于连接的模型的优化模型缩放方法等技术。“可训练的免费技巧包”是一个重要的贡献,它涉及在训练期间应用优化策略(如辅助头和由粗到细的指导),以提高最终模型精度,而不会在推理期间增加计算开销。YOLOv7 主要侧重于目标检测,但具有用于姿势估计等任务的社区扩展。
性能指标和用例
YOLOv7 在发布时,展示了最先进的性能,在速度和准确性之间实现了引人注目的平衡。例如,YOLOv7x 模型在 640 图像尺寸的 MS COCO 数据集上实现了 53.1% 的 mAPtest。它的效率使其适用于需要快速、准确检测的实时应用,如高级安全系统和自动驾驶系统。
优势
- 高精度和速度平衡: 为实时任务提供了强大的 mAP 和推理速度组合。
- 高效训练: 利用先进的训练技术(“免费赠品”)来提高准确性,而不会增加推理成本。
- 成熟的性能: 在 MS COCO 等标准基准测试中,已经证明了其结果。
弱点
- 复杂性: 架构和训练技术可能很复杂,难以完全掌握和优化。
- 资源密集型: 较大的YOLOv7模型需要大量的GPU资源来进行训练。
- 任务多功能性有限: 主要侧重于目标检测,与其他任务(如分割或分类)需要单独实现,而像 YOLO11 这样的集成模型则不需要。
- 碎片化的生态系统: 缺乏 Ultralytics 生态系统中发现的统一框架、广泛的文档和积极的维护。
Ultralytics YOLO11:最先进的效率和通用性
Ultralytics YOLO11由Ultralytics的Glenn Jocher和Jing Qiu撰写,代表了YOLO系列中的最新演进。它于2024年9月27日发布,专为在用户友好的框架内实现卓越的准确性、更高的效率和更广泛的任务多功能性而设计。
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 的架构融合了先进的特征提取技术和精简的网络设计,与 YOLOv8 和 YOLOv7 等前代模型相比,通常能实现更高的精度,同时减少参数数量。这种优化带来了更快的推理速度和更低的计算需求,这对于在从 边缘设备 到云基础设施的各种平台上部署至关重要。
YOLO11 的一个关键优势是其多功能性。它是一个多任务模型,原生支持目标检测、实例分割、图像分类、姿势估计和旋转框检测 (OBB)。它无缝集成到 Ultralytics 生态系统中,通过简单的 Python 和 CLI 界面、广泛的文档以及随时可用的预训练权重,提供简化的用户体验,从而实现高效训练。
优势
- 顶尖性能: 以更高效的架构实现了更高的 mAP 分数。
- 卓越的效率: 在 CPU 和 GPU 上均具有出色的速度,与 YOLOv7 相比,在相当的精度下,参数和 FLOP 明显更少。
- 无与伦比的多功能性: 在单个统一框架中原生支持检测、分割、分类、姿势估计和 OBB。
- 易用性: 具有简单的 API、全面的文档,并与 Ultralytics HUB 等工具无缝集成,可实现无代码训练和部署。
- 完善的生态系统: 受益于积极的开发、强大的社区、频繁的更新和丰富的资源。
- 内存效率: 专为在训练和推理期间降低内存使用率而设计,使其比其他架构更易于访问。
弱点
- 作为一个较新的模型,与较旧、更成熟的模型相比,某些小众的第三方工具集成可能仍在开发中。
- 最大的模型虽然非常准确,但仍然可能需要大量的计算资源来进行训练和部署。
性能正面交锋:YOLO11 vs. YOLOv7
在直接比较性能指标时,Ultralytics YOLO11 的优势变得显而易见。这些模型在整体上实现了准确性和效率之间的更好权衡。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
从表中,可以得出几个关键的见解:
- 准确性和效率: YOLO11l 实现了比 YOLOv7x (53.1) 更高的 mAP (53.4),同时使用的参数 (25.3M vs. 71.3M) 和 FLOPs (86.9B vs. 189.9B) 大幅减少。
- 推理速度: YOLO11模型速度明显更快,尤其是在使用TensorRT的 GPU 上。在 T4 GPU 上,YOLO11l 的速度几乎是 YOLOv7x 的两倍。此外,YOLO11 通过 ONNX 提供强大的 CPU 性能基准,这对于许多无法获得 YOLOv7 数据的实际部署至关重要。
- 可扩展性: YOLO11 系列提供更广泛、更高效的模型范围,从轻量级的 YOLO11n(1.5 毫秒延迟)到高精度的 YOLO11x(54.7 mAP),使开发人员能够根据其特定需求找到完美的平衡。
为什么选择 Ultralytics YOLO11?
虽然 YOLOv7 在当时是一个强大的模型,但 Ultralytics YOLO11 是现代计算机视觉项目的明确选择。它不仅在准确性和速度等核心指标上超越了 YOLOv7,而且还提供了卓越的用户体验和更全面的功能集。
选择 YOLO11 的主要优势包括:
- 统一框架: 一个简单易用的软件包,适用于多个视觉任务,无需管理不同的存储库和环境。
- 积极开发和支持: 作为积极维护的 Ultralytics 生态系统的一部分,YOLO11 持续接收来自大型社区和核心开发团队的更新、错误修复和支持。
- 可用于生产: YOLO11 专注于效率、易于部署和强大的工具,专为实际应用而构建,从 原型设计 到大规模生产。
- 面向未来: 通过采用 YOLO11,开发者可以与对象检测研究的前沿保持一致,并从 Ultralytics 的持续创新中受益。
对于寻求由强大的生态系统支持的现代、通用和高性能模型的开发者来说,Ultralytics YOLO11 是明确的选择。
其他模型对比
为了进一步探索,请考虑以下涉及YOLOv7、YOLO11和其他相关模型的比较:
- YOLO11 vs YOLOv8
- YOLOv7 与 YOLOv8 对比
- YOLOv7 vs YOLOv6
- RT-DETR vs YOLOv7
- 在我们的主要比较页面上探索像 YOLOv10 这样的最新模型和其他比较。