Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 YOLOv8#

实时计算机视觉领域在过去几年中取得了显著发展,每一款新模型都在不断突破边缘设备和云服务器性能的理论极限。在比较较新的 YOLOv9 架构 与广受欢迎的 Ultralytics YOLOv8 框架时,开发者往往需要在前沿的理论梯度路径与经过严苛实战考验的生产级生态系统之间做出选择。

这份综合指南对比了这两大重量级模型,分析了它们的架构创新、性能指标以及理想的部署场景,旨在帮助你为下一个人工智能项目选择最合适的模型。

Link to this section技术规格与作者信息#

了解这些模型的演进脉络,能为你理解它们各自的设计选择提供必要背景。

YOLOv9 YOLOv9 由台湾中央研究院资讯科学研究所的王建尧(Chien-Yao Wang)和廖弘源(Hong-Yuan Mark Liao)开发,于 2024 年 2 月 21 日发布。其核心研究致力于解决深度神经网络中的信息瓶颈问题。你可以在 Arxiv 上查阅原始 YOLOv9 研究论文,或在 YOLOv9 官方 GitHub 仓库 中查看源代码。

了解更多关于 YOLOv9 的信息

Ultralytics YOLOv8 YOLOv8 由 Ultralytics 的 Glenn Jocher、Ayush Chaurasia 和 Jing Qiu 开发,于 2023 年 1 月 10 日发布。它已成为多功能性的行业标准,为各类视觉任务提供统一的 API。其源代码在 Ultralytics GitHub 主仓库 中维护,以确保持续的更新和长期稳定性。

了解更多关于 YOLOv8 的信息

Link to this section架构创新#

Link to this sectionYOLOv9:可编程梯度信息#

YOLOv9 的决定性特征是引入了 可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)。随着卷积神经网络变得越来越深,它们通常会在前向传播过程中丢失关键的特征信息。PGI 通过保留用于更新权重的准确梯度来解决这一信息瓶颈,从而确保了可靠的特征提取。这种架构最大限度地提高了参数效率,使 YOLOv9 能够在较低的浮点运算量 (FLOPs) 下实现高精度。

Link to this sectionYOLOv8:多功能主力模型#

YOLOv8 引入了精简的无锚点 (anchor-free) 检测机制,减少了边界框预测数量,并加快了后处理阶段的非极大值抑制 (NMS) 速度。其 C2f 模块(跨阶段部分瓶颈结构,包含两个卷积)与旧模型相比,改善了网络中的梯度流。更重要的是,YOLOv8 在设计时充分考虑了 多功能性,原生支持 目标检测实例分割姿态估计图像分类旋转边界框 (OBB) 提取功能。

生态系统集成

虽然 YOLOv9 提供了出色的原始检测指标,但将其原生集成到复杂的流水线中可能具有挑战性。通过 Ultralytics 框架使用 YOLOv9 可以弥补这一差距,为你提供我们强大的导出和部署工具。

Link to this section性能平衡与基准测试#

在部署视觉模型时,速度与精度的权衡是最关键的因素。以下是基于标准 COCO 数据集 评估的模型尺寸、延迟和平均精度均值 (mAP) 的详细对比。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

分析各项指标时,YOLOv9 展示了惊人的参数与精度比。YOLOv9c 模型仅使用 25.3M 参数即可达到令人印象深刻的 53.0% mAP。然而,YOLOv8 在硬件加速器上的 内存需求 和推理速度方面保持着显著优势,特别是 YOLOv8n 变体在 NVIDIA TensorRT 环境下推理速度仅为 1.47ms。

Link to this sectionUltralytics 生态系统优势#

选择架构时的一个重要考虑因素是 易用性 和周边的软件生态系统。管理依赖项、编写自定义数据加载器以及处理复杂的导出脚本往往会拖慢开发进度。而集成的 Ultralytics 生态系统消除了这些复杂性。

无论你选择 YOLOv8 还是 YOLOv9(Ultralytics 库全面支持这两者),你都能受益于统一的 API、自动化的 数据增强技术 以及简化的 ONNX 格式 导出功能。此外,Ultralytics 架构通常具有高度优化的 训练效率,避免了大型基于 Transformer 的模型常见的 CUDA 内存膨胀问题。

Link to this section训练代码示例#

使用 Python API 训练这两种模型都非常简单,只需几行代码即可完成。

from ultralytics import YOLO

# Load the preferred model (swap 'yolov9c.pt' with 'yolov8n.pt' as needed)
model = YOLO("yolov8n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance metrics
metrics = model.val()

# Export to ONNX for production deployment
model.export(format="onnx")

Link to this section应用场景与建议#

在 YOLOv9 和 YOLOv8 之间做出选择,取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOv9#

YOLOv9 是以下场景的有力选择:

  • 信息瓶颈研究: 研究可编程梯度信息 (PGI) 和通用高效层聚合网络 (GELAN) 架构的学术项目。
  • 梯度流优化研究: 专注于理解和减轻训练过程中深度网络层信息丢失的研究。
  • 高精度检测基准测试: 需要将 YOLOv9 强大的 COCO 基准表现作为架构对比参考点的场景。

Link to this section何时选择 YOLOv8#

YOLOv8 推荐用于:

  • 多任务部署: 需要在 Ultralytics 生态系统中进行检测分割分类姿态估计的成熟模型项目。
  • 已建立的生产系统: 已经在 YOLOv8 架构上构建,并拥有稳定、经过良好测试的部署流水线的现有生产环境。
  • 广泛的社区和生态支持: 从 YOLOv8 丰富的教程、第三方集成和活跃的社区资源中受益的应用。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section展望未来:YOLO26 的到来#

虽然 YOLOv8 和 YOLOv9 都非常出色,但计算机视觉领域发展迅速。对于现代部署,我们强烈建议使用于 2026 年 1 月发布的 Ultralytics YOLO26

YOLO26 代表了对象检测器在生产环境中运行方式的范式转变。它具有原生的 端到端无 NMS 设计,有效消除了后处理带来的延迟和非确定性行为。为了更好地支持边缘和低功耗硬件,YOLO26 集成了完整的 DFL 移除(分布焦点损失),使移动端导出变得更加简单。

此外,YOLO26 采用了开创性的 MuSGD 优化器,这是 SGD 和 Muon 的混合体,为视觉任务带来了大语言模型级别的训练稳定性,从而实现了显著更快的收敛速度。凭借高达 43% 的 CPU 推理加速 以及集成的 ProgLoss + STAL(显著提升了小目标识别能力),YOLO26 是新企业计划的不二之选。

了解更多关于 YOLO26 的信息

替代架构

根据你的硬件限制,你可能还对将这些模型与 Ultralytics YOLO11 进行对比以用于均衡的通用任务感兴趣,或者探索像 RT-DETR 这样基于 Transformer 的模型以用于专业的超高保真研究。

Link to this section实际应用与使用案例#

选择 YOLOv8 还是 YOLOv9,很大程度上取决于你的项目限制和目标硬件。

  • 医疗保健和医学成像: 当每一个像素都至关重要时,例如在 肿瘤检测系统 中,YOLOv9 的 GELAN 架构能够出色地保留细粒度细节,从而减少关键诊断中的漏诊情况。
  • 零售和库存分析: 对于跟踪高密度货架的 智能超市系统,YOLOv9 提供了可靠区分重叠物品所需的 mAP。
  • 智慧城市和交通监控: 在快节奏的 物流和交通管理 中,YOLOv8 的超低延迟和经过验证的鲁棒性使其非常适合同时跟踪多个摄像头流中的车辆。
  • 边缘部署: 如果你部署到 Raspberry Pi 或 移动硬件 等受限设备,YOLOv8 高度优化的 C2f 模块(以及 YOLO26 的 CPU 优化)可提供更流畅、更节能的推理流水线。

评论