Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 YOLOv5:现代目标检测技术深度解析#

计算机视觉领域经历了巨大的飞跃,目标检测已成为无数工业和研究应用的核心。选择合适的架构通常需要仔细评估平均精度均值 (mAP)、推理速度和内存开销。在本对比中,我们将探讨两个极具影响力的模型:以保留梯度信息方面的架构突破而闻名的 YOLOv9,以及备受考验的行业标准 Ultralytics YOLOv5,它以极其易用和无与伦比的部署灵活性而著称。

Link to this section架构创新与技术起源#

理解这两个模型背后的运行机制,能为你评估其各自的性能表现提供关键背景。

Link to this sectionYOLOv9:可编程梯度信息#

YOLOv9 由台湾中央研究院资讯科学研究所的研究人员王建尧和廖弘源开发,于 2024 年 2 月 21 日发布。该模型引入了两个突破性概念,以解决深度神经网络中常见的信息瓶颈问题:可编程梯度信息 (PGI) 和广义高效层聚合网络 (GELAN)。

通过利用 PGI,YOLOv9 确保了前向传播过程中关键信息的保留,从而实现高度准确的梯度更新。同时,GELAN 架构最大限度地提高了参数效率,使模型能够以极低的计算开销实现顶尖的精度。你可以在官方 YOLOv9 Arxiv 论文 中探索技术细节,或查看 YOLOv9 GitHub 仓库

了解关于 YOLOv9 的更多信息

Link to this sectionUltralytics YOLOv5:生产环境标准#

YOLOv5 由 Glenn Jocher 编写,并于 2020 年 6 月 26 日由 Ultralytics 发布,它彻底改变了计算机视觉的易用性。作为首批原生构建在 PyTorch 框架上的目标检测模型之一,它绕过了旧版 Darknet C 框架的复杂性。YOLOv5 利用高度优化的 CSPNet 主干网络和 PANet 颈部结构,优先平衡了速度与精度。

然而,它最显著的成就是融入了更广阔的 Ultralytics 生态系统。YOLOv5 针对快速 训练效率 和低内存环境进行了深度优化,使其在边缘部署中极其稳定。

了解更多关于 YOLOv5 的信息

内存效率

在评估边缘设备模型时,请记住,与沉重的基于 Transformer 的架构相比,Ultralytics YOLO 模型在训练和推理过程中通常对 GPU 内存的需求显著降低。

Link to this section性能分析:速度与精度之争#

在设计计算机视觉流水线时,开发者必须权衡精度与延迟之间的折衷。下表展示了在标准 COCO 数据集 上的性能差异。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this section分析折衷方案#

YOLOv9 在原始精度上占据绝对优势。YOLOv9e 利用其 GELAN 层来保留细粒度细节,将 mAP 边界推向了 55.6%。这使其成为 医疗影像 或对小目标要求严苛的场景的绝佳选择。

相反,YOLOv5 在原始部署速度和硬件灵活性方面表现出色。YOLOv5n (Nano) 以轻量化著称,通过 TensorRT 在 T4 GPU 上仅需 1.12ms 即可执行推理。如果你要部署到受限的 IoT 设备、移动手机或 Raspberry Pi 上,YOLOv5 的内存占用使其具有极高的可靠性。

Link to this sectionUltralytics 生态系统的优势#

选择模型时的一个重要考量因素是其配套的软件生态系统。虽然 YOLOv9 提供了顶级研究基准,但通过现代 Ultralytics Python API 使用这两个模型弥补了这一差距,为开发者提供了统一且精简的体验。

Link to this section易用性与导出#

Ultralytics 抽象化了复杂的工程难题。诸如自动 数据增强超参数调优 等功能开箱即用。将模型投入生产同样简单,通过内置的导出命令,可以将模型转换为 ONNXOpenVINOTFLite 格式。

Link to this section任务通用性#

虽然这两个模型都擅长 目标检测,但现代 Ultralytics 模型旨在应对各种计算机视觉挑战。更广泛的框架提供了对 图像分类实例分割姿态估计旋转边界框 (OBB) 的原生支持,允许开发者无需切换代码库即可解决多种视觉问题。

Link to this section用例与建议#

在 YOLOv9 和 YOLOv5 之间进行选择,取决于你的具体项目需求、部署约束和生态系统偏好。

Link to this section何时选择 YOLOv9#

YOLOv9 是以下情况的有力选择:

  • 信息瓶颈研究: 研究可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)架构的学术项目。
  • 梯度流优化研究: 专注于理解并减轻深度网络层在训练过程中信息丢失的研究。
  • 高精度检测基准测试: 需要将 YOLOv9 强大的 COCO 基准性能作为架构对比参考点的场景。

Link to this section何时选择 YOLOv5#

建议在以下情况下使用 YOLOv5:

  • 经过验证的生产系统: 在那些重视 YOLOv5 长期稳定性、详尽文档和庞大社区支持的现有部署中。
  • 资源受限的训练: 在 GPU 资源有限且 YOLOv5 高效的训练流水线和较低内存需求更具优势的环境中。
  • 广泛的导出格式支持: 项目需要部署到多种格式,包括 ONNXTensorRTCoreMLTFLite

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能与开发者体验的最佳结合:

  • 无需 NMS 的边缘部署: 需要持续、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 在没有专用 GPU 加速的设备上,YOLO26 的 CPU 推理速度提升高达 43%,这提供了决定性优势。
  • 小目标检测: 具有挑战性的场景,如 航拍无人机图像 或 IoT 传感器分析,ProgLoss 和 STAL 在小目标上显著提升了准确性。

Link to this section实现示例#

Ultralytics 生态系统的优点在于,你只需更改权重字符串,即可在 YOLOv5 模型和 YOLOv9 模型之间轻松切换。

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this section探索更新的架构#

虽然 YOLOv5 和 YOLOv9 是具有独特优势的优秀模型,但该领域仍在持续进步。探索新项目的用户可能还想评估来自 Ultralytics 的最新迭代版本。

  • YOLO11 YOLOv8 系列的强大精炼进化版,在所有视觉任务中提供出色的速度与精度平衡。
  • YOLO26 YOLO26 发布于 2026 年,是现代流水线的终极推荐。它引入了 端到端 NMS-Free 设计,彻底消除了后处理瓶颈。凭借 DFL 移除(移除分布焦点损失以简化导出并提升对边缘/低功耗设备的兼容性),它实现了最高 43% 的 CPU 推理速度提升。通过全新的 MuSGD 优化器,训练稳定性大幅增强;而 ProgLoss + STAL 提供了改进的损失函数,在小目标识别方面有显著提升,这对 IoT、机器人技术和航空影像至关重要,使其成为边缘和云端部署中最稳健的架构。

对于管理大型数据集和复杂部署流水线的团队,利用 Ultralytics Platform 可以提供无代码解决方案,轻松训练、追踪和部署这些尖端模型。

评论