跳转至内容

DAMO-YOLO 与 YOLO26:下一代实时目标检测架构分析

计算机视觉领域不断发展,这得益于对平衡高准确性和低延迟推理架构的需求。本比较深入探讨了DAMO-YOLOUltralytics YOLO26的技术细节,探索了它们的架构创新、训练方法和理想用例。

无论您是将视觉模型部署到边缘设备,还是构建高吞吐量的云管线,了解这些模型之间的细微差别对于在现代 AI 开发中做出明智的架构决策都至关重要。

DAMO-YOLO:大规模神经架构搜索

DAMO-YOLO阿里巴巴集团开发,于2022年11月23日发布。该模型由Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang和Xiuyu Sun设计,主要侧重于利用神经架构搜索(NAS)自动发现高效架构。

您可以在他们的 ArXiv 论文中查阅原始研究,或在 DAMO-YOLO GitHub 仓库上探索源代码。

主要架构特性

DAMO-YOLO 引入了几项技术创新,旨在突破实时目标检测的界限:

  • MAE-NAS 主干网络:DAMO-YOLO 利用多目标进化搜索来寻找最优主干网络。这种NAS方法发现的架构能够严格平衡特定硬件上的检测精度和推理速度。
  • 高效 RepGFPN:一种显著改善特征融合的重颈设计,这在分析航空影像中的复杂场景时非常有益。
  • ZeroHead 设计: 一种高度简化的 detect 头,可最大程度地降低最终预测层的计算复杂性。
  • AlignedOTA 和蒸馏:DAMO-YOLO 采用对齐最优传输分配 (AlignedOTA) 来解决标签分配模糊性,并结合强大的知识蒸馏增强策略,以利用更大的教师网络提升较小学生模型的准确性。

了解更多关于 DAMO-YOLO 的信息

Ultralytics 优势:YOLO26

YOLO26由Glenn Jocher和Jing Qiu在Ultralytics于2026年1月14日发布,代表了可访问、高性能视觉AI的巅峰。YOLO26在YOLO11YOLOv10的基础上,从头开始设计,旨在实现边缘优先部署、多模态通用性和无与伦比的易用性。

YOLO26 创新

Ultralytics YOLO26 引入了多项突破性功能,使其成为现代计算机视觉应用的最终选择:

  • 端到端免NMS设计:YOLO26原生消除了非极大值抑制(NMS)后处理。该方法最初由YOLOv10开创,极大地简化了部署流程,并确保了确定性的低延迟推理。
  • CPU 推理速度提升高达 43%:YOLO26 针对边缘计算进行了架构优化,在边缘设备和标准 CPU 上提供了卓越的速度,使其非常适合电池供电的物联网设备。
  • MuSGD 优化器:受 LLM 训练(如月之暗面 Kimi K2)启发,YOLO26 融合了 SGD 和 Muon 的混合方案。这将大型语言模型的训练稳定性引入计算机视觉领域,从而实现更快、更可靠的收敛。
  • DFL移除:通过移除分布焦点损失,模型图得到简化,从而实现无缝导出到ONNXTensorRT等格式。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面提供了显著改进,这是无人机操作农业的一项关键特性。

特定任务增强

YOLO26 在多种模态上包含了专门的改进:针对 实例分割 的多尺度原型,针对 姿势估计 的残差对数似然估计 (RLE),以及用于缓解 旋转框检测 (OBB) 中边界问题的高级角度损失。

了解更多关于 YOLO26 的信息

性能对比

在评估这些模型时,准确性 (mAP) 与计算效率(速度/FLOPs)之间的平衡至关重要。下表突出显示了这些模型在使用行业标准COCO dataset时的比较情况。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

如上所示,YOLO26 始终以显著更少的参数和 FLOPs 提供更高的精度,从而为训练和推理带来了更高效的架构。

训练效率与易用性

DAMO-YOLO的复杂性

尽管DAMO-YOLO实现了有竞争力的准确性,但其训练方法非常复杂。对神经架构搜索(NAS)和大量知识蒸馏的依赖意味着训练自定义模型通常需要大量的GPU资源和专业知识。这种多阶段过程——训练一个大型教师模型以蒸馏成一个较小的学生模型——可能会阻碍试图在自定义数据集上快速迭代的敏捷工程团队。

简化的Ultralytics体验

相比之下,Ultralytics YOLO26 旨在实现“从零到专家”的易用性。整个训练、验证和部署生命周期都通过简洁统一的 Python API 和 CLI 进行抽象。此外,与 RT-DETR 等基于 Transformer 的模型相比,YOLO26 在训练期间所需的 CUDA 内存显著减少,这使得研究人员能够在消费级硬件上训练最先进的模型。

以下是一个示例,演示了使用Ultralytics SDK训练、评估和导出YOLO26模型是多么简单:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

对于偏好无代码环境的团队,Ultralytics Platform 提供了一个直观的界面,用于数据集标注、云端训练和无缝部署。

真实世界的应用

选择合适的架构在很大程度上取决于目标部署环境和硬件限制。

工业质量控制

对于高速 制造自动化DAMO-YOLO 在专用 GPU 硬件上表现良好。然而,YOLO26 是现代装配线的首选。其 端到端免 NMS 设计 确保了确定性、无抖动的延迟,这在实时同步视觉数据与机器人执行器时至关重要。

边缘 AI 与移动设备

在电池供电设备上部署计算机视觉需要极高的效率。尽管 DAMO-YOLO 依赖于特定的 RepGFPN 颈部,但 YOLO26n (Nano) 专门针对边缘计算进行了优化。其 DFL 移除以及 43% 更快的 CPU 推理速度 使其成为智能相机、移动应用和 安全报警系统 的终极解决方案。

多模态项目要求

如果一个项目不仅仅需要目标检测——例如,使用姿势估计分析体育运动中的玩家机制,或使用实例分割提取精确的像素边界——YOLO26 在一个统一的代码库中为所有这些任务提供原生支持。DAMO-YOLO 严格限于边界框检测。

应用场景与建议

在 DAMO-YOLO 和 YOLO26 之间进行选择取决于您的具体项目要求、部署限制和生态系统偏好。

何时选择 DAMO-YOLO

DAMO-YOLO 是以下场景的有力选择:

  • 高吞吐量视频分析:在固定的NVIDIA GPU基础设施上处理高帧率视频流,其中批次1吞吐量是主要指标。
  • 工业生产线: 在专用硬件上具有严格 GPU 延迟限制的场景,例如装配线上的实时质量检测。
  • 神经网络架构搜索研究:研究自动化架构搜索 (MAE-NAS) 以及高效重参数化主干网络对 detect 性能的影响。

何时选择 YOLO26

YOLO26 推荐用于:

  • 免NMS的边缘部署:需要一致的低延迟推理,且无需非极大值抑制后处理复杂性的应用。
  • 纯CPU环境:在没有专用GPU加速的设备上,YOLO26高达43%的CPU推理速度提升提供了决定性优势。
  • 小目标 detect:无人机航拍图像 或物联网传感器分析等挑战性场景中,ProgLoss 和 STAL 显著提高了微小目标的准确性。

结论

这两种架构都代表了深度学习领域的重大成就。DAMO-YOLO 为我们提供了一个引人入胜的视角,展示了针对特定硬件基准量身定制的神经架构搜索和蒸馏技术的强大功能。

然而,对于寻求生产就绪解决方案的开发者、研究人员和企业而言,Ultralytics YOLO26 脱颖而出,成为卓越之选。其端到端免NMS设计、巨大的CPU推理性能提升、多模态通用性以及与维护良好的Ultralytics生态系统的集成,使其成为当今解决实际计算机视觉挑战最稳健和实用的工具。

对于有兴趣探索 Ultralytics 生态系统中的其他模型的用户,YOLO11、YOLOv8 和基于 Transformer 的RT-DETR均提供全面的文档。


评论