跳转至内容

YOLO26 与 EfficientDet:架构、性能和应用场景

过去十年间,目标detect领域取得了显著发展。塑造这一领域的两个著名架构是Ultralytics YOLO26Google 的 EfficientDet。EfficientDet在2019年引入了一种可扩展且高效的多尺度特征处理方式,而YOLO26则代表了2026年实时计算机视觉的前沿,提供端到端处理和在边缘设备上卓越的速度。

本指南提供详细的技术比较,旨在帮助开发者、研究人员和工程师为其应用选择合适的模型。

模型概述

Ultralytics YOLO26

YOLO26于2026年1月发布,是著名的YOLO(You Only Look Once)系列的最新迭代。它引入了一种原生的免NMS端到端架构,通过消除对非极大值抑制(NMS)后处理的需求,简化了部署流程。YOLO26专为极致效率而设计,在边缘计算场景中表现出色,可在CPU上显著加速而不牺牲准确性。

主要作者:Glenn Jocher 和 Jing Qiu
组织:Ultralytics
发布日期:2026-01-14
许可证:AGPL-3.0(企业版可用)

了解更多关于 YOLO26 的信息

Google EfficientDet

EfficientDet由Google Brain团队(现为Google DeepMind)于2019年末提出。它专注于效率和可扩展性,采用复合缩放方法,统一缩放主干网络、特征网络和预测网络的分辨率、深度和宽度。其核心创新是双向特征金字塔网络(BiFPN),实现了便捷快速的多尺度特征融合。

主要作者:Mingxing Tan、Ruoming Pang 和 Quoc V. Le
组织:Google
发布日期:2019-11-20
许可证:Apache 2.0

性能对比

比较这两种架构时,最显著的区别在于推理速度和部署复杂性。EfficientDet在2019年为效率设定了基准,而YOLO26则利用现代优化显著超越了它,尤其是在对边缘部署至关重要的基于CPU的推理方面。

下表重点介绍了COCO 数据集上的性能指标。请注意 YOLO26 系列显著的速度优势。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

基准测试背景

Speed CPU ONNX指标对于标准硬件上的实际应用尤为重要。YOLO26n实现了出色的38.9毫秒延迟,使其适用于非加速设备上的实时视频处理。相反,EfficientDet的更高迭代版本存在高延迟问题,使其不太适合实时流处理

架构深度解析

YOLO26 创新

YOLO26 代表着与早期模型中传统的基于锚框的detect逻辑的背离。

  • 免NMS端到端逻辑:像EfficientDet这样的传统检测器需要非极大值抑制(NMS)来过滤重叠的边界框。这一步骤计算成本高昂,并且难以在硬件加速器上优化。YOLO26完全消除了这一点,直接预测精确的对象集合。
  • MuSGD 优化器:受大型语言模型(LLM)训练的启发,YOLO26采用了一种结合SGD和Muon的混合优化器。这使得在自定义模型训练期间,训练动态更稳定,收敛速度更快。
  • 移除 DFL:通过移除分布焦点损失(DFL),模型架构得到简化。这种复杂性的降低直接转化为更快的推理速度,并更轻松地导出为 ONNX 和 TensorRT 等格式
  • ProgLoss + STAL:渐进式损失平衡和小目标感知标签分配的引入,显著提升了小目标detect的性能,这是单阶段检测器面临的历史性挑战。

EfficientDet 架构

EfficientDet 基于EfficientNet主干网络构建,并引入了BiFPN(双向特征金字塔网络)。

  • 复合缩放:EfficientDet 使用复合系数(phi)同时缩放分辨率、宽度和深度。这允许用户系统地在D0到D7之间权衡准确性和资源消耗。
  • BiFPN:与标准 FPN 不同,BiFPN 允许信息自上而下和自下而上双向流动,并使用可学习权重来确定不同输入特征的重要性。
  • 基于锚框:EfficientDet 依赖于一组预定义的锚框,需要在自定义数据集上仔细调整长宽比和尺度以获得最佳性能。

可用性与生态系统

YOLO26 和 EfficientDet 之间的主要区别之一在于它们各自的软件生态系统。

Ultralytics 体验

Ultralytics 优先考虑易用性和统一的API。无论您是执行目标检测实例分割姿势估计还是旋转框检测 (OBB),语法都保持一致。

  • 简单易用的 python API:训练模型只需几行代码。
  • 多功能性:YOLO26 开箱即用,支持多项任务。EfficientDet 主要是一个目标检测器,尽管可以通过自定义实现添加分割头。
  • 部署就绪:Ultralytics 生态系统内置支持导出到 CoreML、TFLite、OpenVINO 等,简化了从研究到生产的路径。
from ultralytics import YOLO

# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

EfficientDet 生态系统

EfficientDet 通常通过 TensorFlow Object Detection API 或各种 PyTorch 实现来访问。虽然功能强大,但这些框架通常需要更多的样板代码、复杂的配置文件,并且对初学者来说学习曲线更陡峭。与 YOLO 模型的“开箱即用”特性相比,在自定义数据上高效训练通常需要大量的超参数调整。

用例推荐

何时选择 YOLO26

YOLO26 是大多数现代计算机视觉应用的理想选择,具体而言:

  1. 边缘计算:如果您部署到 Raspberry Pi、移动设备 (iOS/Android) 或 NVIDIA Jetson,高达 43% 更快的 CPU 推理速度使 YOLO26 更具优势。
  2. 实时视频:对于需要高帧率的应用,例如自动驾驶或安防监控,YOLO26 的低延迟至关重要。
  3. 复杂任务:如果您的项目不仅涉及 detect,还涉及姿势估计segment,利用单一统一框架可减少开发开销。
  4. 快速原型开发:活跃的社区和详尽的文档使开发人员能够快速迭代。

何时选用 EfficientDet

尽管通常较慢,EfficientDet 在特定研究背景下仍然具有相关性:

  1. 学术研究:如果您专门研究特征金字塔网络,BiFPN 架构仍然是一个有价值的参考。
  2. 遗留系统:与旧版 TensorFlow 深度集成的现有管道可能会发现维护现有 EfficientDet 模型比迁移更容易。

结论

尽管EfficientDet在特征融合和模型缩放方面引入了开创性概念,但YOLO26代表了下一代视觉 AI。凭借其端到端 NMS-free 设计、卓越的推理速度和更低的内存需求,YOLO26 为当今的 AI 挑战提供了更实用、更强大的解决方案。

对于希望构建稳健、实时应用的开发人员而言,Ultralytics YOLO26 简化的工作流程和性能平衡使其成为明确的推荐。

延伸阅读

在 Ultralytics 文档中探索其他模型:

  • YOLO11:上一代最先进的模型。
  • YOLOv10:NMS-free 训练的先驱。
  • RT-DETR:实时 DEtection TRansformer,另一个优秀的端到端选项。

评论