YOLO11 vs YOLOv8:详细对比
在选择计算机视觉模型时,特别是对于对象检测,理解不同架构的优势和劣势至关重要。本页提供了Ultralytics YOLO11和Ultralytics YOLOv8之间的详细技术比较,这两种最先进的模型专为对象检测和其他视觉任务而设计。我们将分析它们的架构细微差别、性能基准和适用应用,以指导您为您的下一个AI项目做出明智的决定。
Ultralytics YOLO11
作者: Glenn Jocher、Jing Qiu
组织: Ultralytics
日期: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11 代表了 YOLO 系列的最新演进,专为提高准确性和效率而设计。YOLO11 在之前 YOLO 模型强大的基础上,引入了架构改进,旨在提高检测精度,同时保持卓越的实时性能。它是一种高度通用的模型,支持广泛的任务,包括实例分割、图像分类、姿势估计和旋转框检测 (OBB)。
架构和主要特性
YOLO11 结合了网络结构的进步来优化特征提取和处理。与 YOLOv8 等前代产品相比,它以更少的参数和 FLOP 实现了更高的准确性,如下面的性能表所示。这种效率转化为更快的推理速度和更低的计算需求,使其适合在从边缘设备到强大的云基础设施的各种平台上进行部署。YOLO11 的一个主要优势是它可以无缝集成到维护良好的 Ultralytics 生态系统中,与其他许多模型类型相比,该生态系统提供了高效的训练过程、随时可用的预训练权重和更低的内存使用率。
优势
- 卓越的准确性: 实现了最先进的 mAP 分数,在相似的模型尺寸下始终优于 YOLOv8。
- 高效的推理: 提供明显更快的处理速度,尤其是在CPU上,这对于资源受限环境中的实时应用至关重要。
- 多任务通用性: 单个统一框架支持多个计算机视觉任务,从而简化了开发工作流程。
- 优化且可扩展: 在不同硬件上表现良好,具有高效的内存使用率和更小的计算占用空间。
- 易用性: 受益于精简的 Ultralytics API、丰富的文档以及在 GitHub 和 Discord 上的积极社区支持。
弱点
- 作为一个较新的模型,与更成熟的 YOLOv8 相比,它最初可能具有较少的第三方集成。
- 最大的模型(例如,YOLO11x)仍然需要大量的计算资源,这是高精度检测器的常见特征。
应用案例
YOLO11 在准确性和效率之间实现了卓越的平衡,使其成为需要精确和快速目标检测的应用的理想选择,例如:
- 机器人技术:在动态环境中实现导航和物体交互,以用于自主系统。
- 安全系统: 增强高级安全系统,以实现入侵检测和实时监控。
- 零售分析: 改进库存管理和客户行为分析,用于零售业中的人工智能。
- 工业自动化:支持制造业中的质量控制和缺陷检测。
Ultralytics YOLOv8
作者: Glenn Jocher, Ayush Chaurasia, 和 Jing Qiu
机构: Ultralytics
日期: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
文档: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 在发布时为实时目标检测树立了新标准,并迅速成为世界上最受欢迎的视觉模型之一。它引入了关键的架构变化,例如无锚框检测头和 C2f 主干模块,与以前的版本相比,性能有了显著的飞跃。与 YOLO11 一样,YOLOv8 是一种通用的多任务模型,已在无数实际应用中得到广泛验证。
架构和主要特性
YOLOv8 的设计侧重于速度和准确性之间的强大平衡。其无锚框方法减少了框预测的数量,简化了后处理流程并提高了推理速度。该模型具有高度可扩展性,其变体范围从用于移动和 边缘 AI 的轻量级“n”(纳米)版本到用于最大准确性的强大“x”(超大)版本。YOLOv8 已完全集成到 Ultralytics 生态系统中,受益于简单的 API、全面的指南以及诸如 Ultralytics HUB 之类的用于无代码训练和部署的工具。
优势
- 经验证的性能: 一种高度可靠且被广泛采用的模型,可在所有支持的任务中提供强大的结果。
- 卓越的速度-精度权衡: 提供了出色的平衡,使其成为各种应用的首选。
- 成熟的生态系统: 受益于自发布以来积累的广泛的社区支持、教程和第三方集成。
- 多功能性: 支持与 YOLO11 相同的各种视觉任务,使其成为功能强大的多合一解决方案。
弱点
- 虽然它仍然是一个顶级的执行者,但在所有模型尺寸中,YOLO11 在准确性和 CPU 推理速度方面通常都超过了它。
- 与 YOLO11 相比,较大的模型具有更高的参数和 FLOP 计数,从而导致更高的计算要求。
应用案例
YOLOv8 仍然是一个强大且高度相关的模型,在已广泛部署和测试的应用中表现出色:
- 农业:用于智慧农业中的作物监测、病虫害检测和产量估算。
- 医疗保健:协助医学图像分析,用于检测细胞或异常情况等任务。
- 环境监测:部署用于野生动物追踪和监测环境变化。
- 智慧城市: 为诸如 交通管理 和公共安全监控之类的应用提供支持。
性能正面交锋:YOLO11 vs. YOLOv8
YOLO11 和 YOLOv8 之间的主要区别在于它们的性能指标。YOLO11 始终以更高效的架构提供更高的精度 (mAP),从而减少了参数和 FLOPs。这种架构优化在 CPU 推理速度方面尤为明显,YOLO11 模型的速度明显快于其 YOLOv8 等效模型。虽然 YOLOv8n 在 GPU 延迟方面略有优势,但从 's' 到 'x' 的 YOLO11 模型在 GPU 上的速度也更快,这使得 YOLO11 成为大多数新项目的更佳选择。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
架构演进与生态系统
YOLO11 是 YOLOv8 的直接演变,在成功的设计原则的基础上进行了有针对性的优化。这两种模型都秉承快速、准确和易于使用的核心理念。它们在统一的 Ultralytics 存储库中进行开发和维护,从而确保一致和简化的用户体验。
这种共享的生态系统是开发者的一个主要优势。将项目从 YOLOv8 迁移到 YOLO11 非常简单,团队只需进行最少的代码更改,即可利用新模型的性能提升。该生态系统提供:
- 简单且一致的 API,用于训练、验证和预测。
- 内容丰富的文档,包含大量指南和示例。
- 高效训练工作流程,在 COCO 等数据集上提供现成的预训练权重。
- 更低的内存需求:与其他模型类型(如Transformers)相比,在训练和推理期间具有更低的内存需求。
- 活跃的开源社区,提供支持和协作。
结论:您应该选择哪种模型?
对于新项目或那些需要尽可能最佳性能的项目,YOLO11 是明确的选择。它提供卓越的精度和更快的推理速度,尤其是在 CPU 上,并且具有更高效的架构。它的进步使其成为实时目标检测的最新技术。
YOLOv8 仍然是一个出色且高度可靠的模型。对于已经针对其架构进行优化的现有项目,或者在其广泛的跟踪记录和大量第三方集成是关键考虑因素的情况下,它是一个不错的选择。
最终,这两款模型都代表了实时目标检测的巅峰,选择哪一款取决于您的具体项目需求。然而,凭借其明显的性能优势以及与 Ultralytics 生态系统的无缝集成,YOLO11 有望成为开发者和研究人员的新标准。
探索其他模型
虽然 YOLO11 和 YOLOv8 是领先的选择,但计算机视觉领域在不断发展。您可能也有兴趣将它们与 Ultralytics 生态系统中提供的其他强大模型进行比较,例如 YOLOv10、YOLOv9 和基于 Transformer 的 RT-DETR。浏览我们的全方位模型比较,找到最适合您项目的模型。