跳转至内容

YOLO11 与 EfficientDet:全面技术比较

在快速发展的计算机视觉领域,选择合适的物体 detect 模型对于构建成功的 AI 应用至关重要。在这些评估中经常出现的两个著名名称是 Ultralytics YOLO11Google's EfficientDet。尽管这两种架构都旨在解决图像中物体 detect 的问题,但它们以根本不同的设计理念、架构创新和性能优先级来应对这一挑战。

本指南提供了深入的技术比较,旨在帮助开发人员和研究人员理解这两种模型之间的细微差别。我们将探讨它们的架构、性能指标、训练方法和理想用例,强调了为什么现代发展通常更青睐YOLO系列的通用性和速度。

Ultralytics YOLO11:实时视觉领域的最新技术

于2024年末发布,YOLO11代表了Ultralytics著名的“You Only Look Once”架构的最新迭代。它旨在实现推理延迟和准确性之间的最佳权衡,使其成为从边缘设备到云服务器等实时应用的首选。

技术细节:

架构和主要特性

YOLO11 建立在优化的历史基础之上。它采用了精炼的无锚点检测器设计,这通过消除手动锚框计算的需要,简化了训练过程。该架构集成了先进的特征提取层,在减少总参数数量的同时保持高 mAP

与其仅专注于检测的前身或竞争对手不同,YOLO11 是一个多任务框架。单一模型架构可适用于:

Ultralytics 优势

使用 YOLO11 最显著的优势之一是Ultralytics 生态系统。该模型由强大的 python API 和 CLI、活跃的社区维护以及与 MLOps 工具的无缝集成提供支持。这确保了开发者将更少的时间花在与代码搏斗上,而将更多的时间用于部署解决方案。

优势

  • 无与伦比的速度: 针对GPU推理进行了优化,即使在高分辨率流上也能实现实时性能。
  • 多功能性:对多种计算机视觉任务的原生支持,消除了为 segmentation 或姿势估计切换框架的需要。
  • 易用性: 字段 ultralytics 包仅需几行代码即可支持训练、验证和部署。
  • 内存效率:与基于 Transformer 的替代方案或旧架构相比,设计用于以更低的 CUDA 内存要求进行更快训练。

了解更多关于 YOLO11 的信息

Google 的 EfficientDet:优化效率

由 Google Brain 团队于 2019 年底推出,EfficientDet 旨在提高目标检测模型的效率。它主要侧重于优化实现高精度所需的参数数量和理论计算量 (FLOPs)。

技术细节:

架构和主要特性

EfficientDet 基于EfficientNet 骨干网络,并引入了两个关键概念:

  1. BiFPN (双向特征金字塔网络):一个特征融合层,可实现简单的多尺度特征集成,并对输入特征进行不同加权以学习其重要性。
  2. 复合缩放: 一种统一缩放网络分辨率、深度和宽度的方法,创建了从 D0(最小)到 D7(最大)的模型系列。

优势与劣势

EfficientDet 在参数效率方面表现出色,通常比 YOLOv3 等旧模型以更少的参数实现良好的准确性。它具有高度可扩展性,允许用户选择适合其理论 FLOPs 预算的模型大小。

然而,EfficientDet在现代部署场景中存在显著局限性:

  • 较慢的GPU推理:尽管在FLOPs方面效率很高,但EfficientDet中广泛使用的深度可分离卷积与YOLO模型中使用的密集卷积相比,在GPU上的优化程度通常较低。这导致更高的推理延迟
  • 有限的范围:它主要是一个目标检测器,缺乏 YOLO11 中发现的对旋转框检测 或 姿势估计 等复杂任务的原生统一支持。
  • 复杂工具:原始存储库是研究导向的(TensorFlow),缺乏Ultralytics生态系统所特有的精良、用户友好的API和部署工具。

了解更多关于 EfficientDet 的信息

性能对比

在比较 YOLO11 与 EfficientDet 时,最显著的区别在于 GPU 硬件上的实际推理速度。EfficientDet 旨在最小化 FLOPs,而 YOLO11 则致力于最小化延迟,这对于实时应用而言是最重要的指标。

下表说明了这一差距。例如,YOLO11n在准确性(+4.9 mAP)和速度(在T4 GPU上快2.6倍)方面均优于EfficientDet-d0。随着规模的扩大,这种差异变得更加明显;YOLO11x提供了优于EfficientDet-d7的准确性,同时速度快了11倍以上

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

结果分析

  1. 实时能力: YOLO11 在 GPU 上为所有模型尺寸提供真正的实时推理能力,而 EfficientDet 在其较大的变体 (d4-d7) 上难以保持实时帧率 (30 FPS 或约 33 毫秒)。
  2. 精度与速度: 在每个相当的精度点(例如,47.0 mAP)上,YOLO11 变体 (YOLO11s) 比 EfficientDet 等效变体 (EfficientDet-d3) 快得多。
  3. 训练效率:Ultralytics 模型通常收敛更快,并更有效地利用硬件加速,从而降低了在自定义数据集上训练所需的成本和时间。

理想用例

何时选择 Ultralytics YOLO11

YOLO11 是绝大多数现代计算机视觉项目的首选,特别是那些需要平衡速度、精度和开发便捷性的项目。

  • 边缘 AI 与机器人:部署在 NVIDIA Jetson 或 Raspberry Pi 等设备上,在这些设备上,低延迟对于导航或避障等任务是不可或缺的。
  • 商业应用:零售分析、自动化制造和安全监控,在这些领域,可靠性和速度直接影响投资回报率。
  • 多任务系统:需要不仅仅是边界框的项目,例如检查工人是否佩戴安全装备(detect)以及他们的姿势是否正确(姿势估计)。
  • 快速开发:需要利用用户友好的API和详尽文档快速迭代的团队。

何时选择 EfficientDet

EfficientDet 在特定小众场景中仍然具有相关性:

  • 学术基准测试: 研究人员研究复合缩放或 BiFPN 架构的特定影响。
  • 严格的 FLOPs 限制:极度受限的 CPU 环境,其中理论运算量 (FLOPs) 是唯一的限制因素,而不是延迟或内存带宽。

易用性:Ultralytics代码体验

YOLO11的一个显著特点是无缝的开发者体验。虽然传统模型通常需要复杂的配置文件和样板代码,但Ultralytics将工作流程简化为几行直观的Python代码。

以下是加载预训练YOLO11模型并运行推理的简单方法:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

这种简洁性也延伸到自定义数据的训练:

# Train the model on a custom dataset (e.g., COCO8)
model.train(data="coco8.yaml", epochs=100, imgsz=640)

生态系统支持

Ultralytics 提供与流行数据集和工具的无缝集成。无论您是使用Roboflow进行数据管理,还是使用TensorRT进行部署优化,其生态系统都旨在支持您的整个流程。

结论

尽管EfficientDet在模型缩放和效率方面引入了重要概念,但对于当今实际的计算机视觉需求而言,Ultralytics YOLO11是更优越的选择。它提供了以下引人注目的组合:

  • 卓越的性能:在现代硬件上实现更快的推理速度和更高的精度。
  • 更高的通用性:一个统一的框架,支持 detect、segment、姿势估计等多种任务。
  • 更好的可用性:一个维护良好、拥有出色文档和社区支持的生态系统。

对于希望构建强大、高性能和可扩展视觉AI应用的开发者而言,YOLO11 提供了成功所需的强大功能和灵活性。

其他模型对比

探索 YOLO11 如何与其他领先架构进行比较:


评论