Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 DAMO-YOLO#

计算机视觉的快速发展催生了一系列强大的架构,它们旨在满足不同的部署约束和精度要求。在此领域中,两个引人注目的架构是因其强大的信息瓶颈处理能力而闻名的 YOLOv9,以及高度关注神经架构搜索 (NAS) 和高效特征金字塔的 DAMO-YOLO

本指南对 YOLOv9 和 DAMO-YOLO 进行了深入的技术比较,重点介绍了它们的架构差异、训练方法以及理想的部署场景。我们还将探讨 Ultralytics 生态系统 如何提供从开发到生产的无缝路径,以及为什么像 YOLO26 这样的现代模型已成为新项目的推荐标准。

Link to this section架构深度解析#

了解驱动各模型的核心机制,能让你明白它们为何在各种指标上表现各异。

Link to this sectionYOLOv9:可编程梯度信息#

YOLOv9 的设计初衷是直接解决数据流经深度神经网络时发生的信息丢失问题。

作者: Chien-Yao Wang, Hong-Yuan Mark Liao
组织: 台湾中央研究院资讯科学研究所
日期: 2024 年 2 月 21 日
链接: Arxiv, GitHub, 文档

了解更多关于 YOLOv9 的信息

YOLOv9 引入了 可编程梯度信息 (PGI)广义高效层聚合网络 (GELAN)。PGI 确保在正向传播过程中保留关键的空间和语义信息,防止用于权重更新的梯度退化。GELAN 通过最大化参数效率来补充这一点,使模型能够以比许多传统 CNN 更少的 FLOPs 实现最先进的 平均精度均值 (mAP)

Link to this sectionDAMO-YOLO:NAS 驱动的效率#

DAMO-YOLO 由阿里巴巴集团开发,采用了不同的方法,利用自动架构搜索来寻找速度与精度之间的最佳平衡点。

作者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
组织: 阿里巴巴集团
日期: 2022 年 11 月 23 日
链接: Arxiv, GitHub

了解关于 DAMO-YOLO 的更多信息

DAMO-YOLO 依赖于 MAE-NAS(用于神经架构搜索的掩码自动编码器)骨干网来自动生成高效的网络结构。它利用 RepGFPN(重参数化广义特征金字塔网络)进行强大的特征融合,并采用“ZeroHead”设计来最小化检测头的计算负担。此外,它还结合了用于标签分配的 AlignedOTA 和用于提升较小变体性能的知识蒸馏技术。

NAS 在计算机视觉中的作用

神经架构搜索 (NAS) 将人工神经网络的设计自动化。虽然它能产生像 DAMO-YOLO 这样高效的模型,但它通常需要巨大的计算资源来搜索架构空间,这与 YOLOv9 等模型更确定性的设计哲学形成了对比。

Link to this section性能与指标对比#

在选择 目标检测 模型时,平衡精度、速度和计算占用空间至关重要。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Link to this section分析#

  • 精度 vs. 参数: YOLOv9 通常展现出优越的参数与精度比。例如,YOLOv9c 以 25.3M 个参数实现了 53.0% 的 mAP,而 DAMO-YOLOl 实现了 50.8% 的 mAP,但需要更多的参数 (42.1M)。
  • 推理速度: DAMO-YOLO 的架构在 T4 GPU 上提供了极具竞争力的 TensorRT 推理速度,在中等层级上略微领先于 YOLOv9。然而,YOLOv9 在 FLOPs 和参数数量上的效率转化为卓越的 GPU 显存效率
  • 内存需求: Ultralytics YOLO 模型(包括 YOLOv9)在训练和推理过程中的内存占用通常低于复杂的 NAS 生成模型或笨重的 Transformer 架构,这使得它们非常易于在受限的边缘硬件上部署。

Link to this sectionUltralytics 生态系统优势#

虽然理论指标很重要,但实际实现很大程度上决定了一个项目的成败。这就是 Ultralytics 平台 及其全面的软件生态系统胜过 DAMO-YOLO 等独立存储库的地方。

Link to this section易用性与训练效率#

训练自定义 YOLOv9 模型所需的样板代码极少。Ultralytics Python API 抽象了 数据增强、分布式训练和硬件优化等复杂过程。

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate model performance
metrics = model.val()

# Export for production deployment
model.export(format="onnx")

相反,使用 DAMO-YOLO 通常需要处理僵化的配置文件和其独特训练流水线特有的复杂依赖链,导致学习曲线更陡峭。

Link to this section任务的多功能性#

Ultralytics 模型的一个标志是其固有的多功能性。除了标准的边界框检测外,Ultralytics 框架还无缝支持 实例分割姿态估计图像分类旋转边界框 (OBB) 检测等任务。DAMO-YOLO 仅针对 2D 目标检测进行了优化,若要适应其他视觉范式,需要进行大量的重新设计。

导出至边缘设备

Ultralytics 通过提供一键式 模型导出 功能简化了部署流程,支持导出至 TensorRTOpenVINO 和 CoreML 等格式,确保无论你的目标硬件是什么,都能实现最佳性能。

Link to this section应用场景与建议#

在 YOLOv9 和 DAMO-YOLO 之间进行选择取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOv9#

YOLOv9 是以下场景的有力选择:

  • 信息瓶颈研究: 研究可编程梯度信息 (PGI) 和通用高效层聚合网络 (GELAN) 架构的学术项目。
  • 梯度流优化研究: 专注于理解和减轻训练过程中深度网络层信息丢失的研究。
  • 高精度检测基准测试: 需要将 YOLOv9 强大的 COCO 基准表现作为架构对比参考点的场景。

Link to this section何时选择 DAMO-YOLO#

建议在以下场景使用 DAMO-YOLO:

  • 高吞吐量视频分析: 在固定的 NVIDIA GPU 基础设施上处理高 FPS 视频流,其中 batch-1 吞吐量是主要指标。
  • 工业生产线: 在专用硬件上对 GPU 延迟有严格限制的场景,例如生产线上的实时质量检查。
  • 神经架构搜索研究: 研究自动化架构搜索 (MAE-NAS) 和高效重参数化骨干网络对检测性能的影响。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section未来:转向 YOLO26#

虽然 YOLOv9 和 DAMO-YOLO 代表了重要的历史里程碑,但现代计算机视觉已转向原生的端到端架构。对于任何新开发项目,YOLO26 是推荐的标准。

YOLO26 于 2026 年发布,它在前辈成功的基础上,实现了精度和部署简便性的双重飞跃。

Link to this sectionYOLO26 的关键创新#

  • 端到端无需 NMS 设计: YOLO26 完全取消了非极大值抑制 (NMS) 后处理。这创建了一个精简的部署流水线,实现了原生端到端,这一突破最早在 YOLOv10 中被引入。
  • 移除 DFL: 移除了分布焦点损失 (Distribution Focal Loss),以简化导出并提升在边缘/低功耗设备上的兼容性。
  • CPU 推理速度最高提升 43%: 通过移除复杂的后处理并优化核心卷积,YOLO26 特别适用于缺乏专用 GPU 的边缘计算场景。
  • MuSGD 优化器: 受大语言模型训练创新的启发,YOLO26 利用 SGD 和 Muon 的混合体 (MuSGD),确保训练过程更加稳定,并显著加快收敛速度。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面提供了卓越的增强,使 YOLO26 成为高空航空影像和物联网设备的理想选择。

如果你目前正在为下一个项目研究 YOLO11YOLOv8,升级到 YOLO26 可确保你使用的是当今可用的最优化、最前沿的视觉 AI 框架。

Link to this section总结#

选择合适的模型取决于你的具体操作限制:

  • DAMO-YOLO 提供了一个窥探 NAS 驱动优化的迷人视角,为 RepGFPN 架构大放异彩的特定硬件配置文件提供了极具竞争力的速度。
  • YOLOv9 是致力于保留细粒度视觉细节的研究人员的绝佳选择,它利用其 PGI 架构防止深度网络中的信息丢失。
  • Ultralytics YOLO26 是现代企业和研究应用的最终选择。其无与伦比的易用性、无 NMS 架构以及尖端的 MuSGD 训练优化,使其成为计算机视觉领域中最可靠、最精确且最易于部署的模型。

评论