Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 与 YOLOX#

计算机视觉领域见证了实时目标检测架构的快速演变。本指南对 YOLOv9YOLOX 进行了全面比较,分析了它们的架构创新、性能指标和训练方法。无论你是在构建用于 制造业人工智能 的智能应用,还是在探索 预测建模,了解这些模型都将帮助你为下一次部署做出明智的决策。

Link to this section架构创新#

Link to this sectionYOLOv9:可编程梯度信息#

YOLOv9 通过解决深度神经网络中固有的信息瓶颈问题,带来了范式转变。其核心创新包括可编程梯度信息 (PGI) 和通用高效层聚合网络 (GELAN)。

  • 作者: Chien-Yao Wang 和 Hong-Yuan Mark Liao
  • 组织: 台湾中央研究院信息科学研究所
  • 日期: 2024 年 2 月 21 日
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

通过在前向传播过程中保留关键特征数据,YOLOv9 确保了在反向传播过程中用于更新权重的梯度保持准确。该架构在 特征提取 方面表现出色,使其在检测 航空影像 和详细医学扫描等复杂环境中的小目标时具有极高的能力。

了解更多关于 YOLOv9 的信息

Link to this sectionYOLOX:连接研究与工业#

YOLOX 发布于 2021 年中期,将 YOLO 系列推向了无锚(anchor-free)设计。它引入了解耦头,将分类和定位任务分离,并利用 SimOTA 标签分配策略来改善训练收敛。

虽然 YOLOX 在当时具有开创性,实现了出色的 平均精度均值 (mAP) 并消除了锚框超参数调整,但其底层架构此后已被能更好平衡参数数量和特征保留的现代网络所超越。

了解更多关于 YOLOX 的信息

无锚(Anchor-Free)演变

YOLOX 和较新的 Ultralytics 模型都采用了无锚设计,降低了超参数调整的复杂性,并提高了在不同数据集上的泛化能力。

Link to this section性能分析#

在 MS COCO 基准测试中比较这些模型时,YOLOv9 的进步变得显而易见。YOLOv9 在准确率和 FLOPs 之间始终实现了更好的权衡。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

尽管 YOLOX 提供了像 YOLOX-Nano 这样的轻量级变体以应对极端边缘情况,但在纯 准确率 方面,YOLOv9 变体始终优于同等规模的 YOLOX 模型。例如,尽管 YOLOv9m 的参数不到 YOLOXl 的一半(20.0M 对 54.2M),但其 mAP 达到 51.4%,而 YOLOXl 为 49.7%。

Link to this sectionUltralytics 的优势#

选择模型不仅仅涉及架构理论;围绕它的生态系统决定了开发速度和部署的成功。在 Ultralytics 生态系统 中使用 YOLOv9 可提供无与伦比的 易用性 和强大的社区支持。

与较旧的原始研究存储库不同,Ultralytics 框架提供了一个简化的 Python API,简化了复杂的流程。与许多替代方案相比,训练所需 GPU 内存 显著降低,提供了惊人的 训练效率

from ultralytics import YOLO

# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to TensorRT format
model.export(format="engine")

通过对 目标检测实例分割姿态估计 等多种任务的内置支持,你可以快速转换你的计算机视觉解决方案,而无需更改整个代码库。

无缝导出

部署到边缘端?Ultralytics 让你可以通过单个命令轻松地将训练好的模型导出为 ONNXTensorRT 和 OpenVINO 等高度优化的格式。

Link to this section实际应用场景#

这些模型的具体优势使其适用于不同的实际应用:

Link to this section高速零售分析#

对于需要实时产品识别的现代零售环境,YOLOv9 表现出色。其保留复杂特征细节的能力使其非常适合 零售人工智能 部署,在这些部署中,区分拥挤货架上视觉相似的产品至关重要。

Link to this section传统边缘部署#

在受严格硬件限制或在较新的聚合模块上运行困难的专用 NPU 控制的场景中,YOLOX-Nano 有时可以找到一席之地。其纯粹、精简的卷积模式有时更受资源极度受限的 微控制器 的青睐。

Link to this section自主机器人#

对于机器人导航来说,漏检小目标可能是灾难性的。YOLOv9 中的 GELAN 架构确保了网络深层不会丢失远处小障碍物的特征,在 汽车人工智能 应用等关键安全环境中表现优于旧模型。

Link to this section应用场景与建议#

在 YOLOv9 和 YOLOX 之间进行选择取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOv9#

YOLOv9 是以下场景的有力选择:

  • 信息瓶颈研究: 研究可编程梯度信息 (PGI) 和通用高效层聚合网络 (GELAN) 架构的学术项目。
  • 梯度流优化研究: 专注于理解和减轻训练过程中深度网络层信息丢失的研究。
  • 高精度检测基准测试: 需要将 YOLOv9 强大的 COCO 基准表现作为架构对比参考点的场景。

Link to this section何时选择 YOLOX#

推荐 YOLOX 的场景:

  • 无锚点检测研究: 学术研究使用 YOLOX 简洁的无锚点架构作为基准,用于实验新的检测头或损失函数。
  • 超轻量级边缘设备: 部署在微控制器或遗留移动硬件上,此时 YOLOX-Nano 变体极小的体积(0.91M 参数)至关重要。
  • SimOTA 标签分配研究: 探索基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section未来展望:YOLO26 的到来#

虽然 YOLOv9 代表了一个令人印象深刻的里程碑,但生产环境的需求不断挑战极限。新发布的 YOLO26 代表了现代视觉人工智能的最终标准。

YOLO26 通过原生的 端到端无 NMS 设计 彻底重振了部署流程。通过在后处理过程中消除复杂的非极大值抑制(Non-Maximum Suppression)的需求,它显著降低了 推理延迟

此外,YOLO26 结合了开创性的 MuSGD 优化器,这是 SGD 和 Muon 的混合体,借鉴了大型语言模型训练的创新,以提供极其稳定和快速的收敛。通过移除分布式焦点损失(DFL),与前代产品相比,YOLO26 实现了高达 43% 的 CPU 推理速度提升,使其成为边缘设备和企业部署的绝对最佳选择。凭借 ProgLoss 和 STAL 在小目标识别方面的显著改进,YOLO26 有效取代了 YOLOX 和 YOLOv9。

对于正在探索现代架构的工程师,我们也建议查看 YOLO11RT-DETR,它们是 Ultralytics 套件中强大的替代方案。通过利用 Ultralytics 平台上最新模型的无与伦比的性能,确保你的项目经得起未来的考验。

评论