Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet 与 DAMO-YOLO 对比#

在构建可扩展的 计算机视觉 流程时,选择合适的模型架构是一个关键决策,它会影响部署可行性和检测准确性。本指南对视觉识别领域的两种知名架构 EfficientDet 和 DAMO-YOLO 进行了深入的技术对比。

虽然这两种模型都为 目标检测 领域带来了重大创新,但视觉 AI 的飞速发展为更集成的生态系统铺平了道路。在本次分析中,我们将探讨这些传统网络的核心机制,并阐述为何像 Ultralytics PlatformUltralytics YOLO26 这样的现代解决方案已成为生产环境的行业标准。

Link to this sectionEfficientDet:可扩展且高效的目标检测#

EfficientDet 由 Google 的研究人员推出,旨在系统地扩展模型架构,同时保持高效率。它通过在网络深度、宽度和输入分辨率上利用复合缩放来实现这一点。

EfficientDet 详情: 作者:Mingxing Tan, Ruoming Pang, and Quoc V. Le
组织:Google Brain
日期:2019-11-20
Arxiv:1911.09070
GitHub:google/automl

Link to this section架构创新#

EfficientDet 的主要贡献是双向特征金字塔网络 (BiFPN)。与传统的 FPN 不同,BiFPN 通过利用可学习的权重来理解不同输入特征的重要性,从而实现轻松且快速的多尺度特征融合。它结合了 EfficientNet 骨干网络,形成了一个可以进行可预测缩放的模型系列(D0 到 D7)。

Link to this section优势与不足#

EfficientDet 的核心优势在于其参数效率。对于需要在高度受限的云环境中最大化 平均精度均值 (mAP) 的任务,其复合缩放方法具有极高的可预测性。然而,EfficientDet 从头开始训练的难度众所周知,通常需要大量的 超参数调优。此外,它对特定 TensorFlow 操作的严重依赖使得通过 ONNX 或 TensorRT 转向边缘部署时,比现代 YOLO 模型中提供的精简 导出功能 更为繁琐。

了解更多关于 EfficientDet 的信息

Link to this sectionDAMO-YOLO:自动架构搜索的应用#

DAMO-YOLO 代表了一种截然不同的方法,利用神经架构搜索 (NAS) 自动设计用于实时推理的最佳网络结构。

DAMO-YOLO 详情: 作者:Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
组织:阿里巴巴集团
日期:2022-11-23
Arxiv:2211.15444v2
GitHub:tinyvision/DAMO-YOLO

Link to this section架构创新#

DAMO-YOLO 引入了几项新技术。它使用名为 MAE-NAS 的 NAS 生成骨干网络,颈部采用了高效的 RepGFPN,并采用 ZeroHead 设计,大幅降低了 检测头 的计算成本。此外,它还采用 AlignedOTA 进行标签分配,并严重依赖知识蒸馏增强来提升其较小变体的性能。

Link to this section优势与不足#

DAMO-YOLO 在 GPU 推理速度上表现出色,专为使用 TensorRT 在 NVIDIA 架构上部署而设计。通过剔除笨重的检测头结构,该模型可提供低延迟的预测。相反,自动架构搜索可能会使模型结构变得不透明,从而难以手动调试或针对自定义边缘设备进行微调。与功能极其通用的 Ultralytics YOLO11 不同,DAMO-YOLO 主要专注于标准边界框检测,缺乏对 姿态估计旋转边界框 (OBB) 等高级任务的开箱即用支持。

了解关于 DAMO-YOLO 的更多信息

Link to this section性能比较#

了解经验权衡对于选择模型至关重要。下表在关键 性能指标 方面对 EfficientDet 系列与 DAMO-YOLO 系列进行了比较。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
数据分析

EfficientDet-d7 实现了最高的理论精度,但需要巨大的计算能力,使其不适合 边缘 AI。DAMO-YOLO 提供了出色的 TensorRT 速度,尽管为了达到相当的精度,它通常需要比低端 EfficientDet 模型更多的参数。

Link to this section应用场景与建议#

在 EfficientDet 和 DAMO-YOLO 之间进行选择,取决于你的具体项目需求、部署约束和生态系统偏好。

Link to this section何时选择 EfficientDet#

EfficientDet 在以下情况下是理想选择:

  • Google Cloud 和 TPU 流水线: 与 Google Cloud Vision API 或 TPU 基础设施深度集成的系统,EfficientDet 在其中具有原生优化优势。
  • 复合缩放研究: 专注于研究平衡网络深度、宽度和分辨率缩放效果的学术基准测试。
  • 通过 TFLite 进行移动端部署: 专门需要 TensorFlow Lite 导出以用于 Android 或嵌入式 Linux 设备的各种项目。

Link to this section何时选择 DAMO-YOLO#

建议在以下场景使用 DAMO-YOLO:

  • 高吞吐量视频分析: 在固定的 NVIDIA GPU 基础设施上处理高 FPS 视频流,其中 batch-1 吞吐量是主要指标。
  • 工业生产线: 在专用硬件上对 GPU 延迟有严格限制的场景,例如生产线上的实时质量检查。
  • 神经架构搜索研究: 研究自动化架构搜索 (MAE-NAS) 和高效重参数化骨干网络对检测性能的影响。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this sectionUltralytics 的优势:超越传统模型#

虽然 EfficientDet 和 DAMO-YOLO 提供了宝贵的学术见解,但现代开发者需要的是能够平衡最先进性能与开发者体验的框架。这正是 Ultralytics 生态系统 的卓越之处。

Link to this section无与伦比的易用性和生态系统#

部署来自各自独立、高度定制化的研究存储库的模型往往会导致集成噩梦。Ultralytics 提供了一个统一且 维护良好 的生态系统,并配有详尽的文档和 Pythonic API。无论你是使用 Google Colab 进行训练,还是导出到 CoreML 以进行移动端推理,整个流程仅需几行代码。

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

Link to this sectionYOLO26 的变革#

对于正在评估 EfficientDet 或 DAMO-YOLO 的开发者来说,Ultralytics YOLO26 代表了终极进化。它于 2026 年初发布,引入了颠覆性的功能:

  • 端到端无需 NMS 的设计: 这一设计由 YOLOv10 开创,YOLO26 原生消除了对非极大值抑制 (NMS) 后处理的需求。这意味着部署架构得以大幅简化,且在不同硬件上均能保持一致的延迟。
  • CPU 推理速度提升高达 43%: 对于缺乏高性能 GPU 的边缘部署场景——DAMO-YOLO 在此场景下表现吃力——YOLO26 经过了深度优化,在标准 CPU 上实现了大幅度的速度提升。
  • MuSGD 优化器: YOLO26 弥合了 LLM 创新与计算机视觉之间的鸿沟,集成了 MuSGD 优化器(灵感来自 Moonshot AI),相比于 EfficientDet 脆弱的训练循环,确保了极高的训练稳定性和快速收敛。
  • 移除 DFL: 分布焦点损失 (Distribution Focal Loss) 的移除简化了导出流程,保证了其与低功耗微控制器和 Raspberry Pi 设备的出色兼容性。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面产生了显著改进,而在这一领域,传统架构往往会失效。

Link to this section内存效率和任务通用性#

Transformer 模型或过度融合的 NAS 网络不同,Ultralytics 模型的特点在于其严格的内存效率。它们在训练期间消耗的 CUDA 内存极低,从而能够在消费级硬件上快速迭代。

此外,尽管 EfficientDet 和 DAMO-YOLO 被严格限制在边界框任务中,Ultralytics 却能在同一个直观框架内原生支持 实例分割图像分类。对于维护旧项目的用户,Ultralytics YOLOv8 仍然是一个值得探索的稳健且广泛部署的替代方案。

Link to this section结论#

选择正确的视觉架构需要权衡原始理论性能与部署现实。EfficientDet 提供了数学上优雅的缩放方法,而 DAMO-YOLO 提供了令人瞩目的原始 GPU 速度。然而,对于优先考虑快速开发、可靠部署和前沿功能的团队来说,Ultralytics 模型 显然遥遥领先。通过结合无需 NMS 的推理和 MuSGD 优化等创新,YOLO26 确保你的计算机视觉项目建立在当今最强大、可维护且高效的基础之上。

评论