YOLO11 与 EfficientDet:全面的技术对比

计算机视觉项目选择最佳神经网络需要深入了解现有的架构。本指南对 Ultralytics YOLO11 与 Google 的 EfficientDet 进行了深入的技术对比。我们将探讨它们的架构差异、性能指标、训练效率以及理想的部署场景,帮助你为机器学习工作负载做出明智的决策。

模型背景与规格

这两个模型都对深度学习领域产生了重大影响,尽管它们源于不同的设计理念和人工智能发展时期。

YOLO11 详情

作者:Glenn Jocher 和 Jing Qiu 组织:Ultralytics 日期:2024-09-27 GitHub:https://github.com/ultralytics/ultralytics 文档:https://docs.ultralytics.com/models/yolo11/

了解关于 YOLO11 的更多信息

EfficientDet 详情

作者:Mingxing Tan, Ruoming Pang 和 Quoc V. Le 组织:Google 日期:2019-11-20 Arxiv:https://arxiv.org/abs/1911.09070 GitHub:https://github.com/google/automl/tree/master/efficientdet 文档:https://github.com/google/automl/tree/master/efficientdet#readme

了解更多关于 EfficientDet 的信息

生态系统优势

在使用计算机视觉模型时,周边生态系统与模型本身同样重要。Ultralytics 生态系统提供了无与伦比的开发者体验,包括详尽的文档、活跃的社区支持,以及向 ONNXTensorRT 等格式的无缝导出功能。

架构创新

EfficientDet:BiFPN 与复合缩放

EfficientDet 于 2019 年末推出,旨在最大化准确性的同时最小化计算成本。它主要通过两种机制实现这一目标。首先,它使用 EfficientNet 骨干网,该网络可以协调地缩放深度、宽度和分辨率。其次,它引入了双向特征金字塔网络(BiFPN),从而实现简单且快速的多尺度特征融合

尽管在当时非常高效,但 EfficientDet 对 TensorFlow AutoML 库的依赖可能使其显得僵化。与现代模块化的 PyTorch 框架相比,研究人员经常发现模型剪枝和自定义修改具有挑战性。

YOLO11:增强的特征提取与通用性

YOLO11 代表了目标检测架构的重大飞跃。它建立在其前身成功的基础上,引入了精炼的 C3k2 模块和改进的空间金字塔池化模块。这些增强功能带来了卓越的特征提取能力,使 YOLO11 能够以极高的清晰度捕捉复杂的视觉模式。

A major advantage of YOLO11 is its versatility. While EfficientDet is strictly an object detection model, YOLO11 natively supports instance segmentation, image classification, pose estimation, and oriented bounding boxes (OBB). Furthermore, YOLO11 boasts incredibly low memory requirements during both training and inference, making it vastly superior to older models and bulky vision transformers when deploying to resource-constrained edge AI environments.

性能与基准测试

准确性(以平均精度均值 (mAP) 衡量)与推理速度之间的平衡是现实世界部署的关键决定因素。下表展示了两个模型系列在标准 COCO 数据集上的原始性能。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

如所示,YOLO11 实现了极其有利的性能平衡。YOLO11x 实现了最高的整体准确性(54.7 mAP),而较小的 YOLO11 变体在 GPU 推理速度上绝对占优(使用 TensorRT 在 T4 上低至 1.5ms)。

训练效率与生态系统

Ultralytics 模型的定义特征之一是其易用性。训练 EfficientDet 模型通常需要导航复杂的 TensorFlow 图配置并管理复杂的依赖链。相比之下,YOLO11 构建于一个简洁、完全现代化的 PyTorch 基础之上。

这个维护良好的生态系统意味着开发者只需几行代码,即可安装软件包、加载预训练模型并在自定义数据集上开始训练。

Python 代码示例

这是一个完全可运行的示例,演示了 Ultralytics API 的简洁性。此脚本下载一个预训练的 YOLO11 模型,对其进行训练,并执行快速预测。

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

展望未来:YOLO26 的优势

尽管 YOLO11 非常强大,但启动全新绿地项目的团队应重点考虑 2026 年 1 月发布的 Ultralytics YOLO26。YOLO26 代表了部署简便性和边缘性能的范式转换。

YOLO26 的关键创新包括:

  • 端到端无 NMS 设计: 通过在后处理过程中消除非极大值抑制(NMS),YOLO26 确保了始终如一的超低延迟,这对于高速机器人和自动驾驶至关重要。
  • 高达 43% 的 CPU 推理速度提升: 对于缺乏专用 GPU 的部署,YOLO26 经过专门优化,可在标准处理器上最大化吞吐量。
  • MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 启发,这种混合优化器将大模型训练稳定性引入到计算机视觉中,实现了更快的收敛。
  • ProgLoss + STAL: 这些改进的损失函数极大地增强了对小目标的识别,这通常是卫星图像分析和无人机航拍中的痛点。
  • DFL 移除: 分布焦点损失(Distribution Focal Loss)的移除简化了模型导出到边缘设备的过程。
其他值得探索的模型

如果你的项目有非常具体的要求,你可能还需要基准测试基于 Transformer 的检测模型 RT-DETR,或者广泛采用的 YOLOv8,它在许多遗留企业部署中仍然是主力。

用例与建议

在 YOLO11 和 EfficientDet 之间进行选择,取决于你的具体项目要求、部署限制以及生态系统偏好。

何时选择 YOLO11

YOLO11 是以下场景的有力选择:

  • 生产边缘部署:Raspberry PiNVIDIA Jetson 等设备上的商业应用,这些场景中可靠性和积极的维护至关重要。
  • 多任务视觉应用: 需要在单个统一框架内进行 检测分割姿态估计OBB 的项目。
  • 快速原型设计与部署: 需要使用精简的 Ultralytics Python API 快速从数据收集过渡到生产环境的团队。

何时选择 EfficientDet

建议在以下情况下使用 EfficientDet:

  • Google Cloud 和 TPU 流水线: 与 Google Cloud Vision API 或 TPU 基础设施深度集成的系统,其中 EfficientDet 具有原生优化。
  • 复合缩放研究: 专注于研究平衡的网络深度、宽度和分辨率缩放效果的学术基准测试。
  • 通过 TFLite 进行移动端部署: 特别需要 TensorFlow Lite 导出以用于 Android 或嵌入式 Linux 设备的项目。

何时选择 Ultralytics (YOLO26)

对于大多数新项目,Ultralytics YOLO26 提供了性能与开发者体验的最佳结合:

  • 无需 NMS 的边缘部署: 需要持续、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 在没有专用 GPU 加速的设备上,YOLO26 的 CPU 推理速度提升高达 43%,这提供了决定性优势。
  • 小目标检测: 具有挑战性的场景,如 航拍无人机图像 或 IoT 传感器分析,ProgLoss 和 STAL 在小目标上显著提升了准确性。

总结

EfficientDet 是一种开创性的架构,证明了复合缩放方案在目标检测中的可行性。然而,人工智能研究的飞速发展带来了在功能上更强大、更易于集成且运行速度更快的模型。

凭借其强大的多任务处理能力、令人难以置信的 GPU 推理速度,以及可以说是行业内对开发者最友好的 API,YOLO11 是现代视觉流水线的明确赢家。对于那些追求最前沿技术(尤其是边缘优先部署)的人来说,升级到 YOLO26 提供了无 NMS 的速度与无与伦比准确性的终极结合。

评论