EfficientDet 与 YOLO11:详细技术对比
本页详细技术对比了 Google 的 EfficientDet 和 Ultralytics YOLO11 这两个著名的目标检测模型。我们分析了它们的架构、性能基准以及对不同应用的适用性,以帮助您选择最适合您计算机视觉需求的模型。虽然这两种模型都旨在实现高效准确的目标检测,但它们源于不同的研究方向(Google 和 Ultralytics),并采用了不同的架构理念。
EfficientDet
EfficientDet 是 Google Brain 的研究人员开发的一系列对象检测模型。它于 2019 年推出,通过将强大的骨干网络与新颖的特征融合机制和独特的缩放方法相结合,为效率树立了新标准。
技术细节:
- 作者: Mingxing Tan、Ruoming Pang 和 Quoc V. Le
- 组织: Google
- 日期: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- 文档: https://github.com/google/automl/tree/master/efficientdet#readme
架构和主要特性
EfficientDet 的架构建立在三个核心组件之上:
- EfficientNet Backbone: 它使用高效的 EfficientNet 作为其 主干 进行特征提取。
- BiFPN (双向特征金字塔网络): 一种新颖的加权特征金字塔网络,可实现简单快速的多尺度特征融合。它引入了可学习的权重,以理解不同输入特征的重要性,并应用自顶向下和自底向上的连接。
- 复合缩放: 一项关键创新,其中模型深度、宽度和分辨率使用单个复合系数一起放大。这使得模型系列(从 D0 到 D7)能够在各种资源约束下高效缩放。
优势
- 高效性: EfficientDet 模型以其低参数和 FLOPs 计数而闻名,以其计算预算实现了强大的准确率。
- 可扩展性: 复合缩放方法提供了一条清晰的向上或向下扩展模型的路径,使其能够适应从移动设备到数据中心的各种硬件配置。
- 强大的学术基准:它在发布时是最先进的模型,并且仍然是注重效率的研究的强大基线。
弱点
- GPU 推理速度较慢: 尽管 EfficientDet 具有 FLOP 效率,但在 GPU 上的实际推理延迟方面,它可能比像 YOLO11 这样的模型慢,因为 YOLO11 专门为并行处理硬件而设计。
- 有限的多功能性: EfficientDet 主要是一种对象检测器。它缺乏对其他任务的本机支持,例如集成到 Ultralytics 等现代框架中的实例分割、姿势估计或分类。
- 维护较少的生态系统: 官方存储库的开发活跃度不如 Ultralytics 生态系统。这可能会给可用性、社区支持以及与最新工具和部署平台的集成带来挑战。
Ultralytics YOLO11
Ultralytics YOLO11 是 YOLO(You Only Look Once)系列的最新进展,由 Ultralytics 开发。它在先前版本(如 YOLOv8)的成功基础上建立,致力于推动精度和实时性能的边界,同时提供无与伦比的易用性和多功能性。
技术细节:
- 作者: Glenn Jocher, Jing Qiu
- 组织: Ultralytics
- 日期: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档: https://docs.ultralytics.com/models/yolo11/
架构和主要特性
YOLO11 采用针对速度和精度优化的单阶段 无锚框检测器 架构。其设计具有改进的特征提取层和简化的网络结构,可在不牺牲准确性的前提下减少参数数量和计算负载。这确保了在从 边缘设备(如 NVIDIA Jetson)到强大的云服务器等各种硬件上的卓越性能。
YOLO11 的一个显著优势是它集成在全面的 Ultralytics 生态系统中。这为开发者提供了:
- 易用性: 简单直观的 Python API 和 CLI 使训练、验证和推理变得简单。
- 多功能性: YOLO11 是一种多任务模型,在单个统一框架内支持对象检测、实例分割、图像分类、姿势估计和旋转边界框 (OBB)。
- 完善的生态系统: 该模型受益于积极的开发、庞大且支持性强的开源社区、频繁的更新以及与 Ultralytics HUB 等工具的无缝集成,从而实现端到端的 MLOps。
- 训练和内存效率: YOLO11 专为高效训练而设计,通常比其他替代方案需要更少的 CUDA 内存并且收敛速度更快。它在COCO等数据集上提供随时可用的预训练权重。
优势
- 顶尖性能: 实现了高 mAP 分数和快速推理速度的出色平衡,尤其是在 GPU 上。
- 部署灵活性: 针对各种硬件进行了优化,可以轻松导出为 ONNX 和 TensorRT 等格式,以实现最佳性能。
- 用户友好的框架: 拥有广泛的文档、教程和强大的社区支持,降低了初学者和专家的入门门槛。
- 多任务支持: 单个 YOLO11 模型可以针对各种视觉任务进行训练,从而降低开发复杂性和时间。
弱点
- CPU 性能权衡: 虽然针对 GPU 进行了高度优化,但与最小的 EfficientDet 变体相比,较大的 YOLO11 模型在仅 CPU 环境中可能会较慢。
- 小物体检测: 像其他单阶段检测器一样,有时在检测密集场景中极小或严重遮挡的物体时会遇到挑战,但每个版本都在不断改进。
性能与基准
在 COCO val2017 数据集上的性能比较突出了 EfficientDet 和 YOLO11 不同的设计理念。EfficientDet 在理论效率(每个参数/FLOP 的 mAP)方面表现出色,尤其是其较小的模型。然而,在实际部署方面,尤其是在 GPU 上,YOLO11 在推理速度方面表现出明显的优势。
例如,YOLO11s 实现了与 EfficientDet-d3 (47.5) 相当的 mAP (47.0),但在 T4 GPU 上的推理速度却惊人地快了 2.9 倍。最大的模型 YOLO11x 在准确性方面超过了所有 EfficientDet 模型(54.7 mAP),同时在 GPU 上的速度仍然明显快于中等大小的 EfficientDet 模型。这使得 YOLO11 成为 实时推理 至关重要的应用程序的卓越选择。
模型 | 尺寸 (像素) |
mAPval 50-95 |
速度 CPU ONNX (毫秒) |
速度 T4 TensorRT10 (毫秒) |
参数 (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
理想用例
EfficientDet
EfficientDet最适合于计算资源是主要瓶颈,而GPU优化不太关键的场景。
- 学术研究: 非常适合专注于模型效率和架构设计的研究。
- CPU 密集型应用: 较小的变体(D0-D2)可以在没有专用 GPU 的环境中表现良好。
- 成本敏感型云部署: 计费与 FLOPs 或 CPU 使用率直接相关。
YOLO11
YOLO11 在需要高精度、速度和开发效率的各种实际应用中表现出色。
- 自主系统: 通过低延迟感知为机器人技术和自动驾驶汽车提供动力。
- 安全和监控: 为安全系统和公共安全实现实时监控。
- 工业自动化: 用于生产线上高速质量控制和缺陷检测。
- 零售分析: 推动 库存管理 和客户行为分析等应用。
结论
EfficientDet是一个具有里程碑意义的架构,它突破了模型效率的界限。其可扩展的设计仍然是对该领域的一个宝贵贡献,尤其是在资源受限的环境中。
然而,对于寻求最先进、多功能且用户友好的解决方案的开发者和研究人员来说,Ultralytics YOLO11 显然是更明智的选择。它在准确性和实际应用速度方面实现了卓越的结合,尤其是在现代硬件上。YOLO11 的主要优势不仅在于其性能,还在于其周围强大的生态系统。简化的 API、丰富的文档、多任务处理能力以及活跃的社区支持,显著加快了开发和部署的生命周期,使其成为当今应对各种计算机视觉挑战的最实用和强大的选择。
探索其他模型
为了进一步探索,请考虑与其他最先进的模型进行以下比较: