跳转至内容

YOLOX vs DAMO-YOLO:无锚框与 NAS 驱动目标检测器的比较

实时目标检测的演进见证了众多范式转变,从基于锚点到无锚点架构,以及从手动设计骨干网络到自动化神经架构搜索(NAS)。在本次全面的技术比较中,我们将分析这一历程中的两个重要里程碑:YOLOXDAMO-YOLO。我们将探讨它们的架构创新、训练方法和性能权衡,同时也将强调现代Ultralytics YOLO26如何为现代开发者提供无与伦比的替代方案。

YOLOX:开创无锚点范式

YOLOX由郑舸、刘松涛、王峰、李泽明和孙剑在旷视科技于2021年7月18日发布,通过成功将无锚点设计集成到YOLO家族中,标志着一个关键转折点。YOLOX在他们详细的ArXiv技术报告中有所描述,旨在弥合学术研究与工业部署之间的鸿沟。

主要架构创新

YOLOX引入了几项核心结构性转变,大幅改进了其前代产品:

  • 无锚点机制: 通过直接预测物体中心及其边界框尺寸,YOLOX减少了设计启发式方法并简化了复杂的锚点聚类过程。这使其高度适应各种计算机视觉场景。
  • 解耦头:传统的YOLO模型使用单一的耦合头来处理分类和回归。YOLOX引入了解耦头,分别处理分类和定位,这使得模型收敛速度更快,并提高了准确性。
  • SimOTA 标签分配:采用了一种简化版的最优传输分配 (OTA) 来动态分配正样本,从而缩短了训练时间并克服了中心点分配的模糊性。

YOLOX的遗产

YOLOX 的解耦头设计深刻影响了后续的目标检测器,成为许多现代模型的标准特性。

了解更多关于 YOLOX 的信息

DAMO-YOLO:大规模自动化架构搜索

由徐宪哲和阿里巴巴集团的研究团队开发,DAMO-YOLO 于 2022 年 11 月 23 日推出。正如其 ArXiv 论文中所述,该模型大量利用神经架构搜索 (NAS) 来推动速度和准确性的帕累托前沿。

主要架构创新

DAMO-YOLO 的策略建立在自动化设计高效结构的基础上:

  • MAE-NAS 主干网络:利用多目标进化算法,DAMO-YOLO 发现了针对特定延迟预算定制的高效主干网络,尤其是在导出到像TensorRT这样的框架时。
  • 高效 RepGFPN:一种显著增强跨不同空间分辨率特征融合的重颈设计,这对于航空影像分析和检测不同尺度的目标非常有益。
  • ZeroHead: 一种简化的预测头,可在不牺牲模型整体平均精度 (mAP) 的情况下削减计算冗余。
  • AlignedOTA 和蒸馏:结合了先进的标签分配和师生知识蒸馏,以从较小的学生模型中榨取最大性能。

了解更多关于 DAMO-YOLO 的信息

性能与指标比较

比较这两个模型时,我们必须关注它们的参数数量、所需的 FLOPs 和延迟曲线。下面是 YOLOX 和 DAMO-YOLO 在多个尺度上的基准测试数据。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

尽管这两种模型都取得了令人瞩目的成果,但它们也伴随着一些注意事项。YOLOX需要对其解耦头进行仔细调优,而DAMO-YOLO对蒸馏的严重依赖使得在自定义数据集上进行再训练变得资源密集,需要大量的GPU 内存

应用场景与建议

在YOLOX和DAMO-YOLO之间做出选择取决于您的具体项目要求、部署限制和生态系统偏好。

何时选择 YOLOX

YOLOX是以下情况的有力选择:

  • 无锚点检测研究: 学术研究利用YOLOX简洁的无锚点架构作为基线,以实验新的检测头或损失函数。
  • 超轻量级边缘设备:部署到微控制器或传统移动硬件上,YOLOX-Nano 变体极小的占用空间(0.91M 参数)至关重要。
  • SimOTA 标签分配研究:研究基于最优传输的标签分配策略及其对训练收敛性的影响的项目。

何时选择 DAMO-YOLO

DAMO-YOLO 推荐用于:

  • 高吞吐量视频分析:在固定的NVIDIA GPU基础设施上处理高帧率视频流,其中批次1吞吐量是主要指标。
  • 工业生产线: 在专用硬件上具有严格 GPU 延迟限制的场景,例如装配线上的实时质量检测。
  • 神经网络架构搜索研究:研究自动化架构搜索 (MAE-NAS) 以及高效重参数化主干网络对 detect 性能的影响。

何时选择 Ultralytics (YOLO26)

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 免NMS的边缘部署:需要一致的低延迟推理,且无需非极大值抑制后处理复杂性的应用。
  • 纯CPU环境:在没有专用GPU加速的设备上,YOLO26高达43%的CPU推理速度提升提供了决定性优势。
  • 小目标 detect:无人机航拍图像 或物联网传感器分析等挑战性场景中,ProgLoss 和 STAL 显著提高了微小目标的准确性。

Ultralytics 优势:YOLO26 简介

尽管YOLOX和DAMO-YOLO代表了重要的历史里程碑,但现代开发者需要一种将最先进的精度与无与伦比的易用性相结合的解决方案。这正是Ultralytics YOLO26改变格局之处。YOLO26于2026年1月发布,在无NMS模型的传统基础上发展,以提供速度、精度和开发者体验的终极平衡。

为何选择YOLO26?

集成的 Ultralytics 生态系统通过提供以下优势,超越了分散的学术代码库:

  • 端到端免NMS设计:YOLO26原生在推理过程中消除了非极大值抑制(NMS)。这带来了极快、可预测的延迟,对于边缘部署和自动驾驶汽车至关重要。
  • DFL移除:通过移除分布焦点损失,YOLO26简化了向边缘设备的导出过程,大幅降低了轻量级应用程序的内存需求。
  • MuSGD 优化器:YOLO26 借鉴了 LLM 训练创新,采用了混合 SGD 和 Muon 优化器,确保了坚如磐石的训练稳定性和超快的收敛速度。
  • CPU 推理速度提升高达 43%:得益于深度结构优化,YOLO26 在 CPU 上运行速度极快,无需昂贵的 GPU 硬件。
  • 高级损失函数:ProgLoss + STAL 的集成在小目标识别方面提供了巨大的改进,使其非常适合无人机巡检和物联网监控等任务。
  • 多功能性: 与严格作为检测器的DAMO-YOLO不同,YOLO26在一个统一框架中原生支持实例分割姿势估计图像分类旋转边界框 (旋转框检测)任务。

即刻开始构建

借助Ultralytics Python API,您无需手动配置复杂的蒸馏pipeline或编写数百行C++代码来部署您的模型。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast, NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX or OpenVINO with a single command
model.export(format="openvino")

了解更多关于 YOLO26 的信息

其他值得考虑的模型

计算机视觉生态系统广阔。根据您的具体限制,您可能还希望探索 Ultralytics 生态系统完全支持的其他架构:

  • YOLO11: YOLO26 的功能强大的前身,以其在零售分析制造质量控制方面的鲁棒性而闻名。
  • YOLOv8: 一个传奇的、高度稳定的无锚点模型,普及了广泛的边缘部署。
  • RT-DETR: 百度开发的实时 detect Transformer,为那些严重受益于全局注意力机制的任务提供了一个出色的替代方案,尽管代价是更高的训练内存需求。

结论

YOLOX和DAMO-YOLO都为深度学习的进展贡献了重要概念——YOLOX验证了解耦的无锚点方法,DAMO-YOLO则展示了自动化架构搜索的力量。然而,对于实际生产而言,它们原始研究代码库的复杂性可能会减缓敏捷团队的速度。

通过利用全面的 Ultralytics Platform,开发者可以绕过这些障碍。凭借 YOLO26 的端到端设计、卓越的 CPU 速度和详尽的 文档,实现最先进的视觉 AI 比以往任何时候都更容易。无论您是构建智慧城市基础设施、医疗诊断还是先进机器人技术,Ultralytics 都提供了从原始数据到强大、实际部署的最有效途径。


评论