YOLOv8 与YOLO11:技术比较
比较Ultralytics YOLOv8 和YOLO11 的物体检测功能,可以发现实时计算机视觉的进步。由Ultralytics 开发的这两个模型都以速度和准确性为设计目标,但满足的需求略有不同,并基于不同的架构选择。本页提供了详细的技术比较,帮助用户了解它们的主要区别和理想应用。
YOLOv8 概览
YOLOv8由Ultralytics 于 2023-01-10 推出的YOLO 是YOLO 系列的重要迭代产品。YOLOv8 由 Glenn Jocher、Ayush Chaurasia 和 Jing Qiu 合著,其重点是在对象检测、分割、分类和姿态估计等一系列视觉任务中实现多功能性和易用性。YOLO 建立在以前的YOLO 架构基础上,并结合了改进性能和灵活性的增强功能。YOLOv8 文档强调其用户友好性,使初学者和有经验的物体检测领域从业人员都能使用。
建筑和主要特点
YOLOv8 采用单级无锚检测模式,精简了模型架构,简化了训练过程。主要架构特点包括
- 主干网利用经过优化的 CSPDarknet 主干网,提高特征提取效率。
- 颈部在颈部采用 C2f 跨阶段部分网络,以增强特征融合,改善信息流和梯度传播。
- 磁头:解耦检测磁头将分类和回归任务分开,有助于提高准确性和加快收敛速度。
性能指标:
YOLOv8 在不同大小的模型上都达到了最先进的性能。对于 COCO 数据集上的物体检测,最大的变体YOLOv8x 达到了 53.9mAPval50-95,而纳米版本YOLOv8n 则达到了 37.3 mAPval50-95,在准确性和速度之间取得了平衡。推理速度从YOLOv8n 在CPU ONNX 上的 80.4 毫秒到YOLOv8x 的 479.1 毫秒不等,为不同的计算限制提供了选择。探索详细的YOLOv8 性能指标。
使用案例:
YOLOv8 的多功能性使其适用于广泛的应用领域,从安全报警系统和智能城市部署到医疗保健和制造业的高级应用。其均衡的性能使其成为需要兼顾精度和速度的项目的最佳选择。
优势:
- 多功能任务支持:可处理检测、分割、分类和姿势估计。
- 高精度和高速度:在 mAP 和推理速度之间实现了良好的平衡。
- 用户友好型: Ultralytics 文档齐全,易于使用 Python和 CLI接口
- 活跃社区: Benefits from a large community and continuous updates from Ultralytics.
弱点
- 资源密集型:大型模型的训练和部署需要大量计算资源。
- 优化需求:对于资源极其有限的环境,可能需要进一步优化。
YOLO11 概览
YOLO11YOLO 是Ultralytics 于 2024-09-27 发布的最新型号,由 Glenn Jocher 和 Jing Qiu 合著,以YOLO 系列为基础,旨在进一步提高效率和性能。在共享速度和准确性这一核心理念的同时,YOLO11 引入了旨在优化推理速度而又不明显影响准确性的架构改进。YOLO11 的文档突出了其前沿性和对实时应用的适用性。
建筑和主要特点
YOLO11 还采用了单级无锚方法,注重简化设计和高效计算。主要架构包括
- 高效骨干网:采用优化的主干架构,在保持特征提取能力的同时减少计算开销。
- 颈部设计:采用精炼的颈部结构,以更少的参数加强特征聚合,从而加快推理速度。
- 优化磁头:检测磁头的设计旨在将延迟降到最低,并优先考虑最终预测层的速度。
性能指标:
YOLO11 以速度改进为重点,展示了极具竞争力的性能。在 COCO 数据集的物体检测方面,YOLO11x 的mAPval50-95略高于YOLOv8x,达到 54.7,同时在CPU 上保持了更快的推理速度,在GPU 上也达到了相当的速度。YOLO11n 模型的mAPval50-95 为 39.5,比YOLOv8n 有所提高。在CPU 上的推理速度明显更快,YOLO11n 为 56.1 毫秒,YOLO11x 为 462.8 毫秒,这使其适用于CPU应用。有关详细基准,请参阅YOLO11 性能指标。
使用案例:
YOLO11 尤其适合推理速度要求极高的应用,如实时视频分析、机器人和计算资源有限的边缘设备。它的高效性使其非常适合部署在需要在不牺牲精度的情况下快速检测物体的场景中。其应用包括废物管理、环境保护和汽车解决方案。
优势:
- 卓越的推理速度:专为加快推理速度而设计,尤其是在CPU 上。
- 具有竞争力的精度:保持高精度,在较小的模型尺寸中通常超过YOLOv8 。
- 高效架构:针对资源有限的环境和边缘部署进行了优化。
- 最新的Ultralytics 模型:受益于Ultralytics 的最新进展和支持。
弱点
- 大型模型的准确性略有提高:与YOLOv8 相比,较大型的YOLOv8 模型仅在准确性方面略有提高,但计算量仍然很大。
- 较新的模式:与YOLOv8 相比,YOLOv8 的社区规模较小,第三方集成也较少。
型号对照表
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
结论
在YOLOv8 和YOLO11 之间做出选择取决于具体的应用要求。YOLOv8 提供了一个强大的多功能解决方案,适用于各种任务,有效地平衡了精度和速度。它是一个成熟且支持良好的模型,是满足通用对象检测需求的理想选择。另一方面,YOLO11 专为速度优化而设计,在推理时间至关重要的情况下,尤其是在CPU或边缘计算场景中,YOLO11 是一个上佳的选择。对于要求尽可能快的实时性能和具有竞争力的精度的应用,YOLO11 是首选。
有兴趣了解其他模式的用户也可以考虑:
- YOLOv5:对于一个成熟且广泛使用的模型,拥有一个庞大的社区。YOLOv5 与YOLOv8 的比较。
- YOLOv9:适用于注重精度改进和结构创新的模型。YOLOv9 文档。
- FastSAM:用于极快的分割任务。FastSAM 文档。