Link to this sectionYOLOv7 与 DAMO-YOLO#

实时目标检测领域在持续演进，研究人员和工程师们一直致力于在速度和精度之间寻找最优平衡。在这篇技术对比中，我们将深入探讨 2022 年出现的两个著名架构：YOLOv7 和 DAMO-YOLO。这两种模型都为计算机视觉社区引入了新颖的概念，解决了模型训练、架构设计和部署方面的不同挑战。

Link to this section模型背景与技术细节#

在深入研究它们的架构之前，了解这两个模型的起源至关重要。两者均由领先的研究团队开发，并引入了先进的方法论来突破实时目标检测的界限。

Link to this sectionYOLOv7 详情#

作为 YOLO 家族的延续，YOLOv7 引入了可训练的“免费赠品（bag-of-freebies）”概念，在不增加推理成本的情况下显著提高了精度。

作者： Chien-Yao Wang, Alexey Bochkovskiy 和 Hong-Yuan Mark Liao
组织： 台湾中央研究院信息科学研究所
日期： 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
文档: https://docs.ultralytics.com/models/yolov7/

了解更多关于 YOLOv7 的信息

Link to this sectionDAMO-YOLO 详情#

DAMO-YOLO 由阿里巴巴集团的研究人员创建，重点关注神经架构搜索（NAS）和先进的知识蒸馏，旨在为各种硬件构建高效模型。

作者： Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, 和 Xiuyu Sun
组织： 阿里巴巴集团
日期： 2022-11-23
Arxiv： https://arxiv.org/abs/2211.15444v2
GitHub： https://github.com/tinyvision/DAMO-YOLO

了解更多关于 DAMO-YOLO 的信息

Link to this section架构创新#

Link to this sectionYOLOv7：梯度路径分析与重参数化#

YOLOv7 高度关注扩展高效层聚合网络（E-ELAN）。作者通过分析网络的梯度路径设计了 E-ELAN，确保网络能够持续学习而不会削弱原始梯度路径。此外，YOLOv7 在推理过程中有效地利用了模型重参数化，通过无缝融合层来减少 FLOPs 并缩短执行时间。这使其非常适合在现代 GPU 上进行实时推理。

Link to this sectionDAMO-YOLO：神经架构搜索与 RepGFPN#

DAMO-YOLO 的不同之处在于它在延迟约束下大量利用了神经架构搜索（NAS）。它使用一种名为 MAE-NAS 的框架，为移动设备或特定边缘加速器等特定硬件寻找最优骨干网。在颈部结构上，它引入了高效的 RepGFPN（重参数化广义特征金字塔网络），并采用 ZeroHead 设计，以最大限度地降低预测头的计算负担。

蒸馏差异

YOLOv7 依赖于强大的内在架构优化，而 DAMO-YOLO 则很大程度上依赖于复杂的多阶段知识蒸馏过程。它需要训练一个大型教师模型来将知识蒸馏给较小的学生模型，这在训练阶段可能会产生较高的计算成本。

Link to this section性能与指标对比#

在比较这些模型时，查看 mAP（平均精度均值）、推理速度和模型复杂度至关重要。

模型	尺寸 ^(像素)	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	参数量 ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

上表展示了 YOLOv7 在高精度领域（YOLOv7x）的可扩展性，而 DAMO-YOLO 则为受限环境提供了高度优化的轻量级模型。

Link to this section训练效率和内存需求#

这两种架构的主要区别在于它们的训练方法。DAMO-YOLO 对蒸馏的依赖意味着从头训练新模型或在自定义计算机视觉数据集上进行微调时，通常需要更多的显存和 GPU 计算时间。

相比之下，集成到 Ultralytics 生态系统中的模型（如 YOLOv7 及后续版本）针对内存需求进行了深度优化。它们允许开发者在消费级硬件上使用更大的批大小，而不会遇到内存溢出错误，从而简化了实验跟踪和迭代过程。

Link to this sectionUltralytics 的优势#

虽然 YOLOv7 和 DAMO-YOLO 都提供了令人瞩目的特性，但在 Ultralytics 生态系统中部署模型可提供无与伦比的开发者体验。

易用性： Ultralytics Python 包提供了一个统一且简单的 API。你只需几行代码即可快速切换模型架构、启动训练循环或运行推理。
维护良好的生态系统： Ultralytics 提供频繁的更新，确保与最新的 PyTorch 版本和 CUDA 驱动程序保持原生兼容。它还简化了将模型导出为 ONNX、TensorRT 和 OpenVINO 等格式的过程。
通用性： 与严格作为目标检测器的 DAMO-YOLO 不同，Ultralytics 生态系统原生支持多种任务。Ultralytics 系列模型可以执行标准边界框检测、姿态估计、实例分割和旋转边界框 (OBB)。

Link to this section代码示例：快速入门#

以下是使用 Ultralytics 模型加载、训练和运行推理的简便方法：

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model (or newer models like yolo26n.pt)
model = YOLO("yolov7.pt")

# Train the model on the COCO8 dataset with automated hyperparameter handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

导出模型

使用 Ultralytics，将训练好的权重导出为各种硬件加速格式（如 TensorRT 或 CoreML）只需通过导出命令中的一个参数即可完成，节省了配置复杂脚本的时间。

Link to this section下一代：YOLO26#

虽然 YOLOv7 仍然是一个强大的传统架构，但该领域进步神速。对于新部署，推荐使用 Ultralytics YOLO26（2026 年 1 月发布），它在几乎所有指标上都优于前几代产品。

端到端无 NMS 设计： YOLO26 率先在 YOLOv10 中得到应用，它原生去除了非极大值抑制 (NMS) 后处理。这确保了机器人和自动驾驶技术所需的确定性、超低延迟推理。
MuSGD 优化器： 受先进大语言模型训练技术（如 Moonshot AI 的 Kimi K2）启发，这种混合优化器融合了 SGD 和 Muon，从而在不同数据集上实现高度稳定的训练和更快的收敛速度。
CPU 推理速度提升高达 43%： 通过战略性地移除分布焦点损失 (DFL)，YOLO26 显著提升了在边缘计算平台和 CPU 上的性能。
ProgLoss + STAL： 这些先进的损失函数在检测小目标方面取得了显著改进，使 YOLO26 非常适合航空影像和详细监控任务。

了解更多关于 YOLO26 的信息

Link to this section理想使用场景#

Link to this section何时选择 DAMO-YOLO#

NAS 学术研究： 如果你的组织致力于研究神经架构搜索方法论。
特定硬件上的超强延迟限制： 如果你有资源进行详尽的 NAS 搜索，为定制 AI 加速器芯片寻找量身定制的骨干网。

Link to this section何时选择 YOLOv7#

现有的 GPU 流水线： 针对那些在高端 NVIDIA 硬件上围绕 YOLOv7 特定的 E-ELAN 架构进行了深度优化的传统生产流水线的团队。

Link to this section为什么要迁移到现代 Ultralytics 模型（YOLO11 / YOLO26）#

对于绝大多数企业应用——从零售分析和智能制造到医疗保健——现代 Ultralytics 模型是无与伦比的。与 Ultralytics 平台的集成提供了一个完整的 ML 流水线，具有易用性、卓越的文档、强大的社区支持和多任务通用性。无论是在 Raspberry Pi 上跟踪库存还是在云端运行繁重的分析，像 YOLO26 这样的模型都为计算机视觉的未来提供了理想的性能平衡。

贡献者

GLglenn-jocher¹² PDpderrenger¹

创建于 2025年1月27日更新于上个月