Link to this sectionYOLO11 与 EfficientDet:全面的技术对比#
为 computer vision 项目选择最佳神经网络需要深入理解现有的架构。本指南对 Ultralytics YOLO11 和 Google 的 EfficientDet 进行了深入的技术对比。我们将探讨它们的架构差异、performance metrics、训练效率以及理想的部署场景,帮助你为自己的 machine learning 工作负载做出明智的决策。
Link to this section模型背景与规格#
这两个模型都对 deep learning 领域产生了重大影响,尽管它们源于不同的设计理念和 AI 发展时期。
Link to this sectionYOLO11 详情#
作者:Glenn Jocher 和 Jing Qiu
组织:Ultralytics
日期:2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
文档:https://docs.ultralytics.com/models/yolo11/
Link to this sectionEfficientDet 详情#
作者:Mingxing Tan、Ruoming Pang 和 Quoc V. Le
组织:Google
日期:2019-11-20
Arxiv:https://arxiv.org/abs/1911.09070
GitHub:https://github.com/google/automl/tree/master/efficientdet
文档:https://github.com/google/automl/tree/master/efficientdet#readme
在使用计算机视觉模型时,周边生态系统与模型本身同样重要。Ultralytics ecosystem 提供了无与伦比的开发者体验,包括详尽的文档、活跃的社区支持以及向 ONNX 和 TensorRT 等格式的无缝导出能力。
Link to this section架构创新#
Link to this sectionEfficientDet:BiFPN 和复合缩放#
EfficientDet 于 2019 年底推出,旨在最大化准确性的同时最小化计算成本。它主要通过两种机制实现这一目标。首先,它使用了 EfficientNet backbone,可以协调地缩放深度、宽度和分辨率。其次,它引入了双向特征金字塔网络 (BiFPN),实现了简单且快速的多尺度 feature fusion。
虽然在当时效率极高,但 EfficientDet 对 TensorFlow AutoML 库的依赖可能使其显得僵化。相比现代、模块化的 PyTorch 框架,研究人员经常发现对其进行 model pruning 和自定义修改具有挑战性。
Link to this sectionYOLO11:增强的特征提取与多功能性#
YOLO11 代表了 object detection architectures 的重大飞跃。它建立在先前版本成功经验的基础上,引入了改进的 C3k2 块和优化后的 Spatial Pyramid Pooling 模块。这些增强功能带来了更卓越的 feature extraction,使 YOLO11 能够以极高的清晰度捕捉复杂的视觉模式。
A major advantage of YOLO11 is its versatility. While EfficientDet is strictly an object detection model, YOLO11 natively supports instance segmentation, image classification, pose estimation, and oriented bounding boxes (OBB). Furthermore, YOLO11 boasts incredibly low memory requirements during both training and inference, making it vastly superior to older models and bulky vision transformers when deploying to resource-constrained edge AI environments.
Link to this section性能与基准测试#
准确性(以 mean Average Precision (mAP) 衡量)与推理速度之间的平衡是实际部署的关键决定因素。下表说明了两个模型系列在标准 COCO dataset 上的原始性能。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | 参数量 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
如图所示,YOLO11 实现了非常理想的 性能平衡。YOLO11x 达到了最高的整体准确性(54.7 mAP),而较小的 YOLO11 变体在 GPU 推理速度上绝对占优(在 T4 上使用 TensorRT 最低可达 1.5ms)。
Link to this section训练效率与生态系统#
Ultralytics 模型的一个定义特征是其 易用性。训练 EfficientDet 模型通常需要处理复杂的 TensorFlow 图配置和复杂的依赖链。相比之下,YOLO11 构建于一个简洁且极其现代的 PyTorch 基础之上。
这种 维护良好的生态系统 意味着开发者只需几行代码即可安装包、加载预训练模型,并开始在自定义 dataset 上进行训练。
Link to this sectionPython 代码示例#
这是一个完全可运行的示例,演示了 Ultralytics API 的简洁性。该脚本下载一个预训练的 YOLO11 模型,对其进行训练,并运行快速预测。
from ultralytics import YOLO
# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")
# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")
# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the output bounding boxes
prediction[0].show()Link to this section展望未来:YOLO26 的优势#
虽然 YOLO11 功能极其强大,但准备开展新项目的团队应该认真考虑 2026 年 1 月发布的 Ultralytics YOLO26。YOLO26 代表了部署简便性和边缘性能的范式转换。
YOLO26 的主要创新包括:
- 端到端无 NMS 设计: 通过在后处理过程中消除非极大值抑制 (NMS),YOLO26 确保了始终如一、超低延迟的性能,这对高速 robotics 和自动驾驶至关重要。
- CPU 推理速度提升高达 43%: 对于缺乏专用 GPU 的部署环境,YOLO26 经过专门优化,可在标准处理器上最大化吞吐量。
- MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 启发,这种混合优化器将 LLM 训练的稳定性引入到计算机视觉中,实现了更快的收敛速度。
- ProgLoss + STAL: 这些改进的损失函数极大地增强了对小目标的识别能力,这在 satellite image analysis 和无人机拍摄中通常是一个痛点。
- 移除 DFL: 移除分布式焦点损失 (Distribution Focal Loss) 简化了模型导出到边缘设备的过程。
Link to this section应用场景与建议#
在 YOLO11 和 EfficientDet 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。
Link to this section何时选择 YOLO11#
YOLO11 是以下场景的有力选择:
- 生产边缘部署: 在像 Raspberry Pi 或 NVIDIA Jetson 等设备上的商业应用,这些设备对可靠性和主动维护要求极高。
- 多任务视觉应用: 需要在单个统一框架内进行 detection、segmentation、pose estimation 和 OBB 的项目。
- 快速原型开发与部署: 团队需要使用精简的 Ultralytics Python API 从数据收集快速推进到生产环境。
Link to this section何时选择 EfficientDet#
推荐使用 EfficientDet 的场景:
- Google Cloud 和 TPU 流水线: 与 Google Cloud Vision API 或 TPU 基础设施深度集成的系统,EfficientDet 在其中具有原生优化优势。
- 复合缩放研究: 专注于研究平衡网络深度、宽度和分辨率缩放效果的学术基准测试。
- 通过 TFLite 进行移动端部署: 专门需要 TensorFlow Lite 导出以用于 Android 或嵌入式 Linux 设备的各种项目。
Link to this section何时选择 Ultralytics (YOLO26)#
对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:
- 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
- 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
- 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。
Link to this section结论#
EfficientDet 是一项开创性的架构,证明了复合缩放在目标检测中的可行性。然而,人工智能研究的快速发展催生了更强大、更易于集成且运行速度更快的模型。
凭借其强大的多任务处理能力、令人难以置信的 GPU 推理速度以及行业内公认的最开发者友好的 API,YOLO11 是现代视觉管道的明确赢家。对于那些追求最尖端技术(尤其是针对边缘侧优先部署)的用户,升级到 YOLO26 可以提供无 NMS 速度与卓越准确性的极致结合。