YOLOv9 vs YOLO11:技术对比
实时对象检测领域在不断发展,新的模型不断突破可能性的界限。此页面提供了两个强大竞争者之间的深入技术比较:YOLOv9,一种以其架构创新而闻名的模型,以及 Ultralytics YOLO11,来自 Ultralytics 的最新最先进的模型。我们将分析它们的架构、性能指标和理想用例,以帮助您为您的计算机视觉项目选择最佳模型。
YOLOv9:通过新颖架构提高准确性
YOLOv9 的推出是目标检测领域的一大进步,主要致力于解决深度神经网络中的信息损失问题。其新颖的架构组件旨在通过在整个模型中保留更多数据来实现更高的准确率。
技术细节:
- 作者: Chien-Yao Wang, Hong-Yuan Mark Liao
- 组织: 台湾中研院资讯所
- 日期: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- 文档: https://docs.ultralytics.com/models/yolov9/
架构和主要特性
YOLOv9 的核心创新是 可编程梯度信息 (PGI) 和 通用高效层聚合网络 (GELAN)。PGI 旨在为损失函数提供完整的输入信息,从而缓解可能降低极深网络性能的信息瓶颈问题。GELAN 是一种轻量级、高效的网络架构,可优化参数利用率和计算效率。这些功能共同使 YOLOv9 能够在 COCO 等数据集上设置高精度基准。
优势
- 高精度: 在 COCO 数据集上实现了最先进的结果,其最大的变体 YOLOv9-E 达到了很高的 mAP。
- 信息保留: PGI 有效地解决了信息瓶颈问题,这对于训练深度和复杂模型至关重要。
- 高效设计: GELAN 架构提供了强大的准确率与参数比。
弱点
- 任务多功能性: 原始 YOLOv9 研究主要侧重于目标检测。它缺乏对其他任务(如实例分割、姿势估计和分类)的内置统一支持,而这些支持是 Ultralytics 模型中的标准配置。
- 生态系统与可用性: 作为一个独立研究小组的模型,其生态系统不够成熟。集成到生产工作流程中可能更复杂,并且缺乏Ultralytics提供的简化的用户体验、广泛的文档和积极的社区支持。
- 训练资源: 正如其文档中所述,与 Ultralytics 的高度优化模型相比,训练 YOLOv9 可能需要更多的资源和时间。
Ultralytics YOLO11:性能和可用性的巅峰
Ultralytics YOLO11是Ultralytics的最新旗舰模型,旨在提供速度、准确性和多功能性的卓越平衡。YOLO11建立在YOLOv8等前代产品的成功基础上,专为各种实际应用而设计,并针对各种硬件平台上的易用性和部署进行了优化。
技术细节:
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 改进了以前 Ultralytics 模型的成熟架构,融合了先进的特征提取和简化的网络设计。这提高了准确性,减少了参数和计算需求。YOLO11 的主要优势不仅在于其性能,还在于其集成到全面的 Ultralytics 生态系统中。这提供了以下几个主要优势:
- 易用性: 简单直观的 Python API 和 CLI 使初学者和专家都可以轻松训练、验证和部署模型。
- 完善的生态系统: YOLO11 拥有积极的开发、频繁的更新和强大的社区支持。 它可以与 Ultralytics HUB 等工具无缝集成,以实现无代码训练和 MLOps。
- 多功能性: YOLO11 是一种多任务模型,在单个统一框架内支持目标检测、实例分割、图像分类、姿势估计和定向边界框 (OBB)。
- 训练和内存效率: YOLO11 经过高度优化,可实现高效训练,并提供随时可用的预训练权重。与其他模型类型(尤其是大型基于 Transformer 的模型)相比,它通常需要更低的内存来进行训练和推理。
优势
- 卓越的性能平衡: 在速度和准确性之间提供了卓越的权衡,使其成为 实时推理 的理想选择。
- 多任务支持: 单个模型可以处理各种计算机视觉任务,从而提高其效用并降低开发复杂性。
- 硬件优化: 针对从 边缘设备 到云服务器的各种硬件上的部署进行了优化,并在 CPU 和 GPU 上都具有出色的性能。
- 稳健且成熟: 受益于多年的研究和开发,确保生产环境的稳定性和可靠性。
弱点
- 作为一种单阶段检测器,与一些专门的两阶段检测器相比,它在处理极小或拥挤的物体时可能会面临挑战。
- 最大的 YOLO11 模型虽然高效,但仍然需要大量的计算能力才能获得最佳性能。
性能对比:YOLOv9 vs. YOLO11
在比较性能时,很明显这两种模型都非常强大。YOLOv9-E 在 COCO 数据集上实现了最高的 mAP,但这以更高的延迟为代价。相比之下,Ultralytics YOLO11 系列在考虑速度、准确性和计算成本的整体情况时,提供了一个更具吸引力的方案。例如,YOLO11l 实现了与 YOLOv9c 相当的 mAP,但 GPU 推理速度更快。此外,像 YOLO11n 和 YOLO11s 这样的小型模型提供了卓越的实时性能,使其更适合资源受限的应用。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
理想用例
YOLOv9
YOLOv9 最适合以研究为重点的项目或以实现绝对最高的检测精度为主要目标的应用,而易用性、多任务功能和训练时间等因素是次要的。
Ultralytics YOLO11
YOLO11 是绝大多数实际应用的理想选择,从快速原型设计到大规模生产部署。它在性能、多功能性和易用性方面的结合使其成为一种卓越的全面解决方案。
结论:为什么 YOLO11 是推荐选择
虽然 YOLOv9 是一个值得称赞的模型,它引入了重要的学术概念,但Ultralytics YOLO11 作为开发者和研究人员更实用、更强大和更通用的选择脱颖而出。
YOLOv9专注于纯粹的准确性,这一点令人印象深刻,但YOLO11在提供极佳用户体验、多任务处理能力以及强大且有良好支持的生态系统同时,也提供了极具竞争力的性能。对于需要高效地从概念到生产的项目,YOLO11的简化工作流程、丰富的文档和活跃的社区提供了无与伦比的优势。其在速度和准确性之间的平衡方法确保您可以为任何应用找到完美的模型,从轻量级边缘设备到强大的云服务器。
由于以上原因,Ultralytics YOLO11 是构建下一代 AI 驱动的计算机视觉解决方案的明确选择。
探索其他模型
如果您想了解 YOLO11 和 YOLOv9 与生态系统中其他模型的比较,请务必查看我们的其他比较页面。像 YOLOv10 和 RT-DETR 这样的模型在性能和架构上提供了不同的权衡,可能与您的特定需求相关。请浏览我们的主要模型比较页面以获得完整的概述。