Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 YOLO26:现代目标检测的技术深度剖析#

实时目标检测领域在过去几年中发生了巨大演变。随着机器学习从业者寻求在各种硬件上部署模型,选择合适的架构至关重要。在这份全面的技术指南中,我们比较了计算机视觉领域的两个重大里程碑:2024 年初推出的、专注于梯度路径优化的 YOLOv9,以及 2026 年初发布的、彻底重新定义边缘推理和训练稳定性的最新顶尖框架 Ultralytics YOLO26

Link to this section执行摘要:模型起源与作者#

了解这些深度学习模型的起源,能为它们的架构设计选择和目标受众提供宝贵的参考背景。

Link to this sectionYOLOv9#

YOLOv9 由台湾中央研究院资讯科学研究所的王建尧(Chien-Yao Wang)和廖弘源(Hong-Yuan Mark Liao)撰写,于 2024 年 2 月 21 日发布。该模型高度关注深度学习的理论概念,专门解决了深度卷积神经网络(CNN)中的信息瓶颈问题。

了解关于 YOLOv9 的更多信息

Link to this sectionUltralytics YOLO26#

YOLO26 由 Ultralytics 的 Glenn Jocher 和 Jing Qiu 撰写,于 2026 年 1 月 14 日发布。基于 YOLO11YOLOv8 等前代产品的巨大成功,YOLO26 从零开始设计,旨在优先实现生产就绪、边缘部署和原生端到端效率。

了解关于 YOLO26 的更多信息

立即尝试 YOLO26

准备好升级你的计算机视觉流水线了吗?你可以使用 Ultralytics Platform,无需编写任何代码,即可轻松在云端训练和部署 YOLO26 模型。

Link to this section架构创新#

这两个模型都为神经网络处理视觉数据的方式带来了突破性的变革,但它们切入问题的角度各不相同。

Link to this sectionYOLOv9 中的可编程梯度信息#

YOLOv9 对该领域的主要贡献是引入了可编程梯度信息(PGI)广义高效层聚合网络(GELAN)。随着神经网络的加深,它们在正向传播过程中往往会遭受信息丢失。PGI 确保了反向传播期间用于更新权重的梯度保持准确可靠,使 GELAN 架构能够在参数更少的情况下实现高精度。

然而,YOLOv9 在后处理上严重依赖传统的非极大值抑制(NMS),这在实际推理中可能成为延迟瓶颈。

Link to this sectionYOLO26 的边缘优先架构#

YOLO26 采取了截然不同的方法,优化了从训练到实时部署的整个流程。它基于 YOLOv10 开创的端到端无 NMS 设计,完全消除了对 NMS 后处理的需求。这带来了极低的延迟,使其能够针对 Raspberry PiNVIDIA Jetson 等边缘设备进行深度优化。

此外,YOLO26 完全移除了分布式焦点损失(DFL)。这一结构性改变简化了模型导出至 ONNX 的过程,并为低功耗微控制器提供了更好的兼容性。

在训练阶段,YOLO26 集成了全新的 MuSGD 优化器,这是随机梯度下降与 Muon(受 Moonshot AI 的 Kimi K2 的大语言模型训练方法启发)的混合体。它弥合了大语言模型(LLM)训练创新与计算机视觉之间的鸿沟,提供了显著更稳定的训练和更快的收敛时间。

Link to this section性能与指标对比#

在广泛使用的 COCO 数据集上进行基准测试时,这两个模型都表现出了卓越的能力,但 Ultralytics 生态系统在实际推理速度和参数效率方面表现更为出色。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Link to this section结果分析#

  • 速度与效率: 由于 YOLO26 使用了无 NMS 架构和简化的损失函数,相比传统架构,它的 CPU 推理速度提升高达 43%。YOLO26n 模型在使用 TensorRT 的 NVIDIA T4 GPU 上以惊人的 1.7 毫秒运行,使其成为实时视频流的终极选择。
  • 精度: YOLO26x 模型实现了无与伦比的 57.5 mAP,超越了最大的 YOLOv9e 模型,同时保持了更低的延迟。
  • Memory Requirements: Ultralytics models are known for their efficiency. YOLO26 requires significantly less CUDA memory during model training and inference compared to complex transformer-based vision models, allowing developers to utilize larger batch sizes on consumer-grade hardware.

Link to this section生态系统、易用性与多功能性#

Ultralytics 生态系统的真正优势在于其用户体验。虽然研究人员使用 YOLOv9 GitHub 代码库时必须处理复杂的环境设置和手动脚本,但 YOLO26 已完全集成到直观的 Ultralytics Python API 中。

Link to this section精简的 API 示例#

训练一个最先进的 YOLO26 模型仅需几行 Python 代码

from ultralytics import YOLO

# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export natively to ONNX format in a single command
model.export(format="onnx")

Link to this section无可比拟的任务多功能性#

与主要针对标准目标检测的 YOLOv9 不同,YOLO26 原生支持开箱即用的各种计算机视觉任务。该架构包含针对不同应用的特定增强功能:

  • 实例分割 具有专用的语义分割损失和多尺度 proto,可实现完美的像素级遮罩。
  • 姿态估计 集成了残差对数似然估计(RLE),以极高精度跟踪骨骼关键点。
  • 旋转目标检测 (OBB) 包含专门设计的角度损失函数,用于解决航拍图像中旋转目标检测的边界问题。
  • 图像分类 基于 ImageNet 标准,为整张图像提供稳健的分类。
集成生态系统

所有 YOLO26 模型均受益于与 Ultralytics Platform 的无缝集成,提供内置的数据集标注、主动学习和即时部署流水线。

Link to this section现实世界应用#

在这两个模型之间进行选择,往往取决于它们的部署环境。

Link to this section物联网与边缘机器人#

对于机器人、自动无人机和智能家居物联网设备,YOLO26 是毋庸置疑的冠军。ProgLoss + STAL 的集成显著改进了小目标识别,这对于农业监测中高空无人机的应用至关重要。结合其快 43% 的 CPU 推理速度和无 NMS 设计,YOLO26 可以在没有专用 GPU 的硬件上流畅运行。

Link to this section学术研究与梯度分析#

YOLOv9 在学术界仍然是一个备受推崇的模型。研究梯度流理论边界的研究人员,或者寻求基于 PGI 概念构建自定义 PyTorch 层的人,会发现 YOLOv9 的代码库是探索深度学习理论的绝佳基础。

Link to this section高速制造流水线#

在高速传送带上的自动缺陷检测等工业环境中,YOLO26 模型飞快的 TensorRT 速度确保了不会丢帧,最大限度地提高了质量保证系统的吞吐量。

Link to this section用例与建议#

在 YOLOv9 和 YOLO26 之间进行选择取决于你的具体项目需求、部署约束和生态系统偏好。

Link to this section何时选择 YOLOv9#

YOLOv9 是以下情况的有力选择:

  • 信息瓶颈研究: 研究可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)架构的学术项目。
  • 梯度流优化研究: 专注于理解并减轻深度网络层在训练过程中信息丢失的研究。
  • 高精度检测基准测试: 需要将 YOLOv9 强大的 COCO 基准性能作为架构对比参考点的场景。

Link to this section何时选择 YOLO26#

YOLO26 推荐用于:

  • 无需 NMS 的边缘部署: 需要持续、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 在没有专用 GPU 加速的设备上,YOLO26 的 CPU 推理速度提升高达 43%,这提供了决定性优势。
  • 小目标检测: 具有挑战性的场景,如 航拍无人机图像 或 IoT 传感器分析,ProgLoss 和 STAL 在小目标上显著提升了准确性。

Link to this section总结#

这两个模型都代表了开源社区的巨大飞跃。YOLOv9 为梯度流引入了至关重要的理论改进,这些改进将持续影响未来的架构设计。然而,对于寻求速度、精度和部署便捷性完美平衡的现代开发者、初创公司和企业团队来说,Ultralytics YOLO26 是明确的推荐。

通过消除 NMS、引入强大的 MuSGD 优化器,并提供涵盖检测、分割和姿态任务的一流工具套件,YOLO26 确保你的计算机视觉项目建立在当今最可靠、面向未来的框架之上。

评论