YOLO11 vs YOLOv7:物体检测的详细技术比较
要在计算机视觉任务中实现最佳性能,选择正确的物体检测模型至关重要。本页对Ultralytics YOLO11 和 YOLOv7 进行了详细的技术比较。我们将探讨它们在架构上的细微差别、性能基准和合适的应用,以指导您做出明智的决定。
Ultralytics YOLO11
Ultralytics YOLO11 由Ultralytics 的 Glenn Jocher 和 Jing Qiu 合著,于 2024-09-27 发布,是YOLO 系列的最新进化版。它的重点是提高物体检测的准确性和效率,使其能够广泛应用于现实世界。 Ultralytics YOLO11以以前的YOLO 模型为基础,改进了网络结构,在保持实时性能的同时实现了最先进的检测精度。
建筑和主要特点
与YOLOv8 等模型相比,YOLOv8 的架构采用了先进的特征提取技术,从而在减少参数数量的同时提高了准确性。这一优化提高了推理引擎的速度,降低了计算需求,使其适用于从边缘设备到云基础设施等各种平台的部署。YOLO11 支持多种计算机视觉任务,包括物体检测、实例分割、图像分类和姿态估计。该模型可在GitHub 上获取。
性能指标和基准:
YOLO11 在不同大小的模型上都显示出令人印象深刻的平均精度 (mAP)分数。例如,YOLO11m 在图像大小为 640 的情况下,mAPval50-95 达到 51.5,有效地平衡了速度和精度。YOLO11n 和 YOLO11s 等较小的变体为优先考虑速度的应用提供了更快的实时推理,而 YOLO11x 等较大的模型则最大限度地提高了准确性。有关详细的YOLO 性能指标,请查阅Ultralytics 文档。
使用案例:
YOLO11 具有更高的精度和效率,因此非常适合需要精确、实时物体检测的应用,例如:..:
- 机器人用于动态环境中的精确导航和物体互动。
- 安全系统:先进的安全警报系统,可准确探测入侵并进行全面监控。
- 零售分析:用于零售业的人工智能,以改进库存管理和深入的客户行为分析。
- 工业自动化:用于生产过程中严格的质量控制和高效的缺陷检测。
优势:
- 高精度:通过精巧的架构实现最先进的 mAP。
- 高效推理:适合实时应用的快速处理。
- 多功能任务:支持物体检测、分割、分类和姿态估计。
- 可扩展性:从边缘设备到云系统,可在不同硬件上有效运行。
弱点
- 与经过速度优化的小型模型相比,大型模型可能需要更多的计算资源。
- 针对特定边缘设备的优化可能需要额外的模型部署配置。
YOLOv7
YOLOv7 于 2022 年 7 月由来自台湾中央研究院信息科学研究所的王建尧、Alexey Bochkovskiy 和廖鸿源推出,以其可训练的免费包而闻名,为实时物体检测器树立了新的标杆。YOLOv7 在其arXiv 论文和GitHub 存储库中有详细介绍,它强调速度和效率,同时在物体检测任务中保持高精度。
建筑和主要特点
YOLOv7 以高效层聚合网络(ELAN)为基础,引入了扩展 ELAN(E-ELAN),以增强网络的学习能力。它采用了模型重参数化和动态标签分配等技术来提高训练效率和推理速度。YOLOv7 专为各种应用中的高性能目标检测而设计。
性能指标和基准:
YOLOv7 的性能指标非常出色,在 640 像素大小的 COCO 数据集上,mAP 达到 51.4%。YOLOv7 的速度也很显著,基本 YOLOv7 模型在第一批推理中达到了 161 FPS。有关详细的性能基准,请参阅YOLOv7 官方 GitHub 代码库。
使用案例:
YOLOv7 兼顾了速度和精度,适用于各种应用,包括
- 实时物体检测:非常适合需要快速检测的应用,如自动驾驶和快节奏视频分析。
- 高性能计算:适用于计算资源充足、高精度与速度并重的环境。
- 研究与开发:一个强大的基准模型,用于进一步研究物体检测架构和训练方法。
优势:
- 高速:推理速度惊人,适合实时系统。
- 准确性高:在基准数据集上提供具有竞争力的 mAP 分数。
- 高效架构:利用 E-ELAN 和模型重参数化提高性能。
弱点
- 与 YOLO11n 等用于边缘部署场景的较小、较新模型相比,可能需要更多计算资源。
- 该架构虽然高效,但与YOLO11 相比,在支持物体检测以外的多种视觉任务方面,其功能不够全面。
型号对照表
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
结论
YOLO11 和 YOLOv7 都是功能强大的物体检测模型,各自具有独特的优势。YOLO11 在多功能性和效率方面表现出色,能够以最先进的精度和速度支持多种视觉任务,是各种应用和部署环境的理想选择。YOLOv7 虽然也很高效,但特别针对高速物体检测进行了优化,适用于实时应用和研究目的。如何在两者之间做出选择,取决于您项目的具体要求,同时要兼顾任务的多功能性、精度需求和部署限制等因素。
对于有兴趣探索其他模型的用户,Ultralytics 还提供了以精简高效和多功能而著称的YOLOv8,以及因其速度和易用性而被广泛采用的YOLOv5。您还可以考虑将YOLO11 与 YOLOv9 进行比较,或者探索RT-DETR 等模型,以了解对象检测的不同架构方法。