Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet 与 YOLOX:目标检测全面对比#

在架构设计现代 计算机视觉 流程时,选择合适的模型是一项关键决策,它决定了准确性和实时性的可行性。这份技术指南详细对比了神经网络演进过程中的两个核心架构:Google 的 EfficientDet 和 Megvii 的 YOLOX。我们将分析它们的架构范式,评估它们的基准性能,并探讨它们与新发布的 Ultralytics YOLO26 等最先进解决方案的对比情况。

Link to this sectionEfficientDet 概览#

由 Google Brain 团队推出的 EfficientDet 开创了一种高度结构化的模型缩放方法,证明了与当时参数量巨大的网络相比,它能以显著更少的参数实现高 准确性

EfficientDet 详情:

Link to this section架构亮点#

EfficientDet 基于 EfficientNet 主干网络构建,应用了一种复合缩放方法,统一缩放网络的分辨率、深度和宽度。其标志性功能是 双向特征金字塔网络 (BiFPN),它实现了快速且有效的多尺度特征融合。通过对不同输入特征采用可学习的权重,BiFPN 确保网络优先处理更关键的空间数据。

尽管 EfficientDet 的理论 FLOPs 极低,但它对 TensorFlow 生态系统和较旧的 AutoML 配置的依赖,使其难以集成到现代、快节奏的 PyTorch 工作流中。此外,其复杂的多分支网络有时会导致在训练期间的内存消耗高于现代 YOLO 变体。

了解更多关于 EfficientDet 的信息

Link to this sectionYOLOX 概述#

YOLOX 在两年后发布,旨在通过将传统 YOLO 架构转换为无锚框 (anchor-free) 框架,架起学术研究与工业部署之间的桥梁。

YOLOX 详情:

Link to this section架构亮点#

YOLOX 显著简化了目标检测范式。通过切换到 无锚框 (anchor-free) 设计,YOLOX 消除了对复杂、特定于数据集的锚框调优的需求,减少了启发式开销。它还集成了分离头(将分类和定位任务分开),大幅提高了收敛速度。此外,引入的 SimOTA 标签分配策略在训练期间动态优化了正样本的分配。

尽管有这些改进,管理 YOLOX 代码库通常需要编译手动 C++ 扩展并处理复杂的依赖关系,这可能会阻碍经验较少的团队进行快速的 模型部署

了解更多关于 YOLOX 的信息

Link to this section性能对比#

在评估生产模型时,平衡 平均精度均值 (mAP) 和推理速度至关重要。下表直接比较了 EfficientDet 和 YOLOX 系列在标准 COCO 基准测试中的表现。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
性能洞察

虽然 EfficientDet 在其较大的 d7 变体上实现了高精度,但 YOLOX 在 GPU 硬件(通过 TensorRT)上提供了优越得多的延迟表现,使其成为自动驾驶或体育追踪等高 FPS 应用的更好选择。

Link to this section用例与建议#

选择 EfficientDet 还是 YOLOX 取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 EfficientDet#

EfficientDet 是以下场景的有力选择:

  • Google Cloud 和 TPU 流水线: 与 Google Cloud Vision API 或 TPU 基础设施深度集成的系统,其中 EfficientDet 具有原生优化。
  • 复合缩放研究: 专注于研究平衡的网络深度、宽度和分辨率缩放效果的学术基准测试。
  • 通过 TFLite 进行移动端部署: 特别需要 TensorFlow Lite 导出以用于 Android 或嵌入式 Linux 设备的项目。

Link to this section何时选择 YOLOX#

推荐在以下场景使用 YOLOX:

  • 无锚框检测研究: 使用 YOLOX 简洁的无锚框架构作为基准,进行新检测头或损失函数实验的学术研究。
  • 超轻量级边缘设备: 部署在微控制器或旧款移动硬件上,此时 YOLOX-Nano 变体极小的空间占用(0.91M 参数)至关重要。
  • SimOTA 标签分配研究: 调查基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能与开发者体验的最佳结合:

  • 无需 NMS 的边缘部署: 需要持续、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 在没有专用 GPU 加速的设备上,YOLO26 的 CPU 推理速度提升高达 43%,这提供了决定性优势。
  • 小目标检测: 具有挑战性的场景,如 航拍无人机图像 或 IoT 传感器分析,ProgLoss 和 STAL 在小目标上显著提升了准确性。

Link to this sectionUltralytics 的优势:介绍 YOLO26#

虽然 EfficientDet 和 YOLOX 在各自的时代代表了重大飞跃,但现代计算机视觉需要更大的多功能性、更简化的工作流和毫不妥协的速度。对于优先考虑易用性、更低内存需求和维护良好的生态系统的开发者,我们强烈建议升级到 2026 年 1 月发布的 Ultralytics YOLO26

YOLO26 代表了 YOLO 系列的范式转变,系统性地克服了 YOLOX 和 EfficientDet 等旧模型中存在的问题:

  • 端到端 NMS-Free 设计: 与需要昂贵的非极大值抑制 (NMS) 后处理的 EfficientDet 和 YOLOX 不同,YOLO26 原生支持端到端。这消除了延迟瓶颈并大大简化了边缘部署。
  • CPU 推理速度提升高达 43%: 通过战略性的架构调优和 DFL 去除 (Distribution Focal Loss),YOLO26 针对没有专用 GPU 的环境进行了独特优化,在 Raspberry Pi 等 边缘 AI 硬件上完全超越了 EfficientDet。
  • MuSGD 优化器: 受大模型训练创新(如 Moonshot AI 的 Kimi K2)启发,YOLO26 使用了 SGD 和 Muon 的混合体。这确保了极其稳定的训练和更快的收敛速度,远优于较旧的 TensorFlow 估计器。
  • ProgLoss + STAL: 先进的损失函数显著改进了小目标识别,这是 YOLOX 和 EfficientDet 历史上的弱点。这对无人机分析和物联网至关重要。
  • 令人难以置信的多功能性: 虽然 EfficientDet 和 YOLOX 仅限于边界框检测,但 YOLO26 原生支持 实例分割姿态估计(通过残差对数似然估计)和 旋转边界框 (OBB)

了解关于 YOLO26 的更多信息

Link to this section简化的用户体验与训练效率#

YOLOX 等模型面临的最大障碍之一是设置训练环境。Ultralytics Platform 提供了一个统一的 Python SDK,只需几行代码即可训练最先进的模型。此外,YOLO 模型具有高度优化的数据加载器,确保与重型 Transformer 模型或旧的多分支网络相比,CUDA 内存使用率显著降低。

from ultralytics import YOLO

# Load the cutting-edge YOLO26n model (NMS-free!)
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model seamlessly to ONNX or OpenVINO for edge deployment
model.export(format="openvino")

Link to this section结论:做出正确的选择#

如果你正在维护一个深度嵌入 TensorFlow 生态系统的遗留系统,EfficientDet 仍然是一个稳定的选择,特别是在理论上需要大规模复合缩放的场景中。相反,如果你在遗留的无锚框代码库上需要纯粹的速度,YOLOX 是一款快速、可靠的检测器。

然而,对于进入生产阶段的任何新项目,选择毫无疑问是 Ultralytics YOLO26(或用于遗留企业支持的高度稳定的 YOLO11)。通过提供端到端的 NMS-free 架构、大幅提高的 CPU 速度,以及通过 OpenVINO 和 TensorRT 等平台实现的无缝部署流水线,YOLO26 确保你的计算机视觉应用面向未来、高精度且极易维护。

评论