Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 与 YOLOv7:全面的技术对比#

实时目标检测的演进经历了多个里程碑,Ultralytics YOLO26YOLOv7 代表了计算机视觉能力的两大重大飞跃。虽然 YOLOv7 在 2022 年引入了强大的“免费包(bag-of-freebies)”方法论并重新定义了精度基准,但新发布的 YOLO26 架构开创了边缘优先优化、原生端到端处理,以及受大语言模型(LLM)创新启发而来的稳定训练动态。

本次深度解析对比了这两种架构,通过分析它们的性能指标、结构差异和理想部署场景,帮助机器学习工程师为他们的下一个视觉 AI 项目做出明智的决策。

Link to this section模型背景与详情#

在查看性能数据之前,了解每个模型的起源和主要目标非常重要。

Link to this sectionUltralytics YOLO26#

作者: Glenn Jocher 和 Jing Qiu
组织: Ultralytics
日期: 2026-01-14
GitHub: Ultralytics 仓库
文档: YOLO26 文档

了解更多关于 YOLO26 的信息

Link to this sectionYOLOv7#

作者: Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao
组织: 台湾中央研究院信息科学研究所
日期: 2022-07-06
Arxiv: YOLOv7 论文
GitHub: YOLOv7 仓库

了解更多关于 YOLOv7 的信息

可考虑的其他模型

如果你正在探索更广阔的生态系统,你可能还会对适用于高度平衡多任务部署的 YOLO11 感兴趣,或是对基于 Transformer 的 RT-DETR 感兴趣,后者适用于基于序列的检测。请注意,像 YOLOv8YOLOv5 这样的旧模型在 Ultralytics Platform 上仍得到全面支持,以便进行遗留系统集成。

Link to this section架构深度解析#

YOLO26 和 YOLOv7 背后的架构理念存在显著差异,反映了从最大化高端 GPU 性能到针对无缝端到端边缘部署进行优化的转变。

Link to this sectionYOLO26:边缘优先的范式#

YOLO26 发布于 2026 年,它从根本上重新思考了部署流水线。其最重大的突破是端到端无 NMS 设计。通过消除 非极大值抑制 (NMS) 后处理,YOLO26 极大地降低了延迟波动,这一概念最早在 YOLOv10 中成功试点。这确保了即使在人口密集的场景中也能保持一致的帧率,这对自主机器人和交通监控至关重要。

此外,YOLO26 完全移除了 Distribution Focal Loss (DFL)。这一 DFL Removal 简化了导出到 ONNXApple CoreML 等格式的过程,实现了高达 43% 的 CPU 推理加速

训练稳定性是另一个主要重点。引入 MuSGD 优化器(一种结合了标准 随机梯度下降 和 Muon(受 Kimi K2 训练动态启发)的混合优化器),将先进的 LLM 训练稳定性带入了计算机视觉领域。结合 ProgLoss + STAL 损失函数,YOLO26 在小目标识别方面表现卓越,而这在实时检测器中一直是一个历史性挑战。

Link to this sectionYOLOv7:免费包(Bag-of-Freebies)的掌握#

YOLOv7 是基于对梯度路径优化的详尽研究而构建的。其核心创新是扩展高效层聚合网络 (E-ELAN),它允许模型在不破坏原始梯度路径的情况下学习更多样化的特征。

YOLOv7 架构在推理过程中还严重依赖重参数化技术,本质上是将层融合以提升速度,而不会牺牲训练过程中学到的丰富特征表示。虽然在标准的 NVIDIA TensorRT 服务器 GPU 上表现强劲,但这种方法仍依赖于基于锚点的检测头和传统的 NMS,这可能会给低功耗设备上的部署带来阻碍。

Link to this section性能比较#

下表提供了在标准 COCO 数据集上训练的模型的直接对比。YOLO26 在保持参数和 FLOPs 卓越平衡的同时,在精度 (mAP) 上表现出显著改进。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

注意:YOLO26x 在 mAP 上以惊人的幅度优于 YOLOv7x (57.5 vs 53.1),同时所需参数减少了约 22%。

Link to this sectionUltralytics 生态系统优势#

开发者持续选择 YOLO26 的一个主要原因是其深入集成了 Ultralytics Platform。与旧架构所需的独立脚本不同,Ultralytics 提供了一个无缝、统一的工作流。

  1. 易用性: Python API 让你可以通过寥寥几行代码加载、训练和部署模型。导出到 TensorFlow Lite 等移动端格式仅需更改一个参数。
  2. 内存需求: Ultralytics 模型专为训练效率而精心设计。与笨重的视觉 Transformer 模型相比,它们所需的 CUDA 内存显著更少,使研究人员能够在消费级硬件上运行更大的批次。
  3. 多功能性: 虽然 YOLOv7 对不同任务需要完全不同的代码仓库,但 YOLO26 从一个单一、紧凑的库中原生支持 图像分类实例分割姿态估计旋转边界框 (OBB) 检测。它甚至包括针对特定任务的损失函数,例如用于人体姿态流水线的残差对数似然估计 (RLE)。
  4. 活跃开发: Ultralytics 开源社区提供频繁更新,确保快速解决边缘案例,并与最新的 PyTorch 版本保持持续兼容。
简化的导出

由于 YOLO26 原生无 NMS,因此使用 Intel OpenVINO 或 ONNX Runtime 部署到嵌入式目标时,完全免除了复杂的后处理脚本。

Link to this section实际应用场景#

这些模型之间的架构差异决定了它们各自的理想部署场景。

Link to this section何时选择 YOLO26#

对于现代、具有前瞻性的计算机视觉系统,YOLO26 是无可争议的首选推荐。

  • 边缘 AI 和 IoT: 凭借其 43% 的 CPU 推理速度提升和轻量级的参数计数,YOLO26n 非常适合 Raspberry Pi 或智能城市摄像头等受限设备。
  • 无人机和航拍图像: ProgLoss + STAL 的集成显著改进了小目标检测,使其成为管道检查和精准农业的首选。
  • 多任务机器人: 由于它能以最小的内存开销同时轻松处理边界框、分割掩码和姿态关键点,因此非常适合动态机器人导航和交互。

Link to this section何时考虑 YOLOv7#

虽然 YOLOv7 大多已被更新的架构所取代,但它仍保留了特定的利基用途。

  • 学术基准测试: 开发新型基于锚点的检测头或研究梯度路径策略的研究人员,经常使用 YOLOv7 作为 Papers With Code 等平台上的标准基准对比。
  • 遗留 GPU 流水线: 在功能强大的 AWS EC2 P4d 实例上围绕 YOLOv7 特定张量输出和自定义 NMS 配置进行定制开发的企业系统,可能会推迟向更新模型的迁移,直到必须进行全面系统重构时。

Link to this section代码示例:入门#

开发者体验凸显了标准研究库与 Ultralytics 生态系统之间的鲜明对比。训练一个自定义 YOLO26 模型非常直接:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on your custom dataset with automated caching and logging
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Perform an end-to-end NMS-free prediction on an external image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model for edge deployment
model.export(format="onnx")

Link to this section总结#

虽然 YOLOv7 在实时目标检测史上仍然是一个受人尊敬的里程碑,但行业已积极转向优先考虑部署简洁性、多任务通用性和边缘效率的模型。

通过消除 NMS、引入 MuSGD 优化器并显著提升 CPU 推理速度,Ultralytics YOLO26 成为当今开发者和企业工程师的终极选择。结合稳健、用户友好的 Ultralytics 生态系统,它提供了速度、精度和工程体验的无与伦比的平衡。

评论