YOLO26 模型的 ONNX 导出

~43% 的推理加速。
  • 将 Ultralytics YOLO26 模型导出为 ONNX 可带来高达 43% 的推理速度提升,实现更快、更高效的部署。

通常在部署 计算机视觉 模型时,你需要一种既灵活又兼容多个平台的模型格式。

Ultralytics YOLO26 模型导出为 ONNX 格式可简化部署流程,并确保在不同环境下的最佳性能。本指南将展示如何轻松地将你的 YOLO26 模型转换为 ONNX,并提升它们在现实应用中的可扩展性和有效性。



Watch: Ultralytics YOLO26 vs Ultralytics YOLO11 ONNX Inference Test | ~43% Faster Inference with YOLO26 🚀

ONNX 和 ONNX Runtime

ONNX 代表开放式 神经网络 交换,是一个由 Facebook 和 Microsoft 最初开发的社区项目。ONNX 的持续发展是一个由 IBM、Amazon(通过 AWS)和 Google 等各组织支持的协作努力。该项目旨在创建一个开放的文件格式,用于表示 机器学习 模型,从而允许它们在不同的 AI 框架和硬件之间使用。

ONNX 模型可以用于在不同框架之间无缝迁移。例如,在 PyTorch 中训练的 深度学习 模型可以导出为 ONNX 格式,然后轻松导入到 TensorFlow 中。

ONNX model portability across deep learning frameworks

或者,ONNX 模型可以与 ONNX Runtime 一起使用。ONNX Runtime 是一种通用的跨平台机器学习模型加速器,兼容 PyTorch、TensorFlow、TFLite、scikit-learn 等框架。

ONNX Runtime 通过利用特定于硬件的功能来优化 ONNX 模型的执行。这种优化使得模型能够在包括 CPU、GPU 和专用加速器在内的各种硬件平台上高效且高性能地运行。

ONNX Runtime cross-platform inference acceleration

无论独立使用还是与 ONNX Runtime 配合使用,ONNX 都为机器学习 模型部署 和兼容性提供了一种灵活的解决方案。

ONNX 模型的主要功能

ONNX 处理各种格式的能力可归因于以下主要功能:

  • 通用模型表示:ONNX 定义了一组通用的算子(如卷积、层等)和标准数据格式。当模型转换为 ONNX 格式时,其架构和权重会被翻译成这种通用表示。这种统一性确保了任何支持 ONNX 的框架都能理解该模型。

  • 版本控制和向后兼容性:ONNX 为其算子维护了一个版本控制系统。这确保了即使标准在不断演进,使用旧版本创建的模型依然可用。向后兼容性是一个至关重要的功能,可以防止模型迅速过时。

  • 基于图的模型表示:ONNX 将模型表示为计算图。这种基于图的结构是一种表示机器学习模型的通用方法,其中节点代表操作或计算,边代表在它们之间流动的张量。这种格式非常容易适应也使用图来表示模型的各种框架。

  • 工具和生态系统:围绕 ONNX 存在着一个丰富的工具生态系统,用于辅助模型转换、可视化和优化。这些工具使开发人员更容易使用 ONNX 模型,并能无缝地在不同框架之间转换模型。

ONNX 的常见用途

在我们了解如何将 YOLO26 模型导出为 ONNX 格式之前,先来看一下 ONNX 模型通常用在什么地方。

CPU 部署

由于与 ONNX Runtime 的兼容性,ONNX 模型通常部署在 CPU 上。此运行时已针对 CPU 执行进行了优化。它显著提升了推理速度,并使实时 CPU 部署成为可能。

支持的部署选项

虽然 ONNX 模型常用于 CPU,但它们也可以部署在以下平台上:

  • GPU 加速:ONNX 完全支持 GPU 加速,特别是 NVIDIA CUDA。这使得在需要高性能计算能力的任务上,能够在 NVIDIA GPU 上高效执行。

  • 边缘和移动设备:ONNX 扩展到边缘和移动设备,非常适合端侧和实时推理场景。它轻量级且兼容边缘硬件。

  • Web 浏览器:ONNX 可以直接在 Web 浏览器中运行,为交互式和动态的 Web AI 应用提供支持。

将 YOLO26 模型导出到 ONNX

你可以通过将 YOLO26 模型转换为 ONNX 格式来扩展模型兼容性和部署灵活性。Ultralytics YOLO26 提供了简单的导出过程,可以显著提升模型在不同平台上的性能。

安装

要安装所需的包,请运行:

安装
# Install the required package for YOLO26
pip install ultralytics

有关安装过程的详细说明和最佳实践,请查看我们的 YOLO26 安装指南。在安装 YOLO26 所需的软件包时,如果遇到任何困难,请参考我们的 常见问题指南 获取解决方案和建议。

使用方法

在深入了解使用说明之前,请务必查看 Ultralytics 提供的各种 YOLO26 模型。这将有助于你选择最符合项目需求的模型。

使用方法
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format
model.export(format="onnx")  # creates 'yolo26n.onnx'

# Load the exported ONNX model
onnx_model = YOLO("yolo26n.onnx")

# Run inference
results = onnx_model("https://ultralytics.com/images/bus.jpg")

导出参数

在将你的 YOLO26 模型导出为 ONNX 格式时,你可以使用各种参数来自定义此过程,以优化你的特定部署需求:

参数类型默认值描述
formatstr'onnx'导出模型的目标格式,定义与各种部署环境的兼容性。
imgszinttuple640模型输入的所需图像尺寸。可以是正方形图像的整数,也可以是特定维度的元组 (height, width)
halfboolFalse启用 FP16(半精度)量化,减小模型大小并可能在受支持的硬件上加快推理速度。
dynamicboolFalse允许动态输入大小,提高了处理不同图像尺寸的灵活性。
simplifyboolTrue通过 onnxslim 简化模型图,从而潜在地提高性能和兼容性。
opsetintNone指定用于与不同 ONNX 解析器和运行时兼容的 ONNX opset 版本。如果不设置,将使用最新的支持版本。
nmsboolFalse添加非极大值抑制(NMS),这对于准确且高效的检测后处理至关重要。
batchint1指定导出模型的批量推理大小,或者导出模型在 predict 模式下将同时处理的最大图像数量。
devicestrNone指定导出的设备:GPU (device=0)、CPU (device=cpu)、适用于 Apple 芯片的 MPS (device=mps)。

有关导出过程的更多详细信息,请访问 Ultralytics 导出文档页面

部署导出的 YOLO26 ONNX 模型

一旦成功将 Ultralytics YOLO26 模型导出为 ONNX 格式,下一步就是在各种环境中部署这些模型。有关部署 ONNX 模型的详细说明,请参考以下资源:

  • ONNX Runtime Python API 文档:本指南提供了加载和运行使用 ONNX Runtime 的 ONNX 模型的基本信息。

  • 边缘设备部署:查看此文档页面,了解在边缘设备上部署 ONNX 模型的各种示例。

  • GitHub 上的 ONNX 教程:一系列全面的教程,涵盖了在不同场景下使用和实现 ONNX 模型的各个方面。

  • Triton Inference Server:了解如何通过 NVIDIA 的 Triton Inference Server 部署你的 ONNX 模型,以实现高性能、可扩展的部署。

总结

在本指南中,你已经了解了如何将 Ultralytics YOLO26 模型导出为 ONNX 格式,以增加它们在各种平台上的互操作性和性能。你还了解了 ONNX Runtime 和 ONNX 部署选项。

ONNX 导出只是 Ultralytics YOLO26 支持的众多 导出格式 之一,它允许你在几乎任何环境中部署你的模型。根据你的具体需求,你可能还想探索其他导出选项,例如用于获得最大 GPU 性能的 TensorRT 或用于 Apple 设备的 CoreML

有关用法的更多详细信息,请访问 ONNX 官方文档

此外,如果你想了解有关其他 Ultralytics YOLO26 集成的更多信息,请访问我们的 集成指南页面。你会在那里找到大量有用的资源和见解。

常见问题 (FAQ)

如何使用 Ultralytics 将 YOLO26 模型导出为 ONNX 格式?

要使用 Ultralytics 将 YOLO26 模型导出为 ONNX 格式,请按照以下步骤操作:

使用方法
from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to ONNX format
model.export(format="onnx")  # creates 'yolo26n.onnx'

# Load the exported ONNX model
onnx_model = YOLO("yolo26n.onnx")

# Run inference
results = onnx_model("https://ultralytics.com/images/bus.jpg")

更多详细信息,请访问 导出文档

使用 ONNX Runtime 部署 YOLO26 模型有哪些优势?

使用 ONNX Runtime 部署 YOLO26 模型有几个优势:

  • 跨平台兼容性:ONNX Runtime 支持各种平台,如 Windows、macOS 和 Linux,确保你的模型在不同环境中都能顺利运行。
  • 硬件加速:ONNX Runtime 可以利用针对 CPU、GPU 和专用加速器的特定于硬件的优化,提供高性能的推理。
  • 框架互操作性:在 PyTorch 或 TensorFlow 等流行框架中训练的模型可以轻松转换为 ONNX 格式,并使用 ONNX Runtime 运行。
  • 性能优化:与原生 PyTorch 模型相比,ONNX Runtime 可提供高达 3 倍的 CPU 加速,使其非常适合 GPU 资源受限的部署场景。

通过查看 ONNX Runtime 文档 了解更多信息。

导出为 ONNX 的 YOLO26 模型有哪些部署选项?

导出为 ONNX 的 YOLO26 模型可以部署在各种平台上,包括:

  • CPU:利用 ONNX Runtime 进行优化的 CPU 推理。
  • GPU:利用 NVIDIA CUDA 进行高性能 GPU 加速。
  • 边缘设备:在边缘和移动设备上运行轻量级模型,实现实时的端侧推理。
  • Web 浏览器:直接在 Web 浏览器内执行模型,用于交互式 Web 应用。
  • 云服务:部署在支持 ONNX 格式的云平台上,实现可扩展的推理。

欲了解更多信息,请浏览我们的 模型部署选项 指南。

为什么我应该为 Ultralytics YOLO26 模型使用 ONNX 格式?

为 Ultralytics YOLO26 模型使用 ONNX 格式提供了诸多好处:

  • 互操作性:ONNX 允许模型在不同的机器学习框架之间无缝迁移。
  • 性能优化:ONNX Runtime 可以通过利用特定于硬件的优化来增强模型性能。
  • 灵活性:ONNX 支持各种部署环境,使你无需修改即可在不同平台上使用相同的模型。
  • 标准化:ONNX 提供了一种在整个行业内广泛支持的标准化格式,确保了长期兼容性。

请参阅关于 将 YOLO26 模型导出为 ONNX 的综合指南。

在导出 YOLO26 模型到 ONNX 时,我该如何排查问题?

当将 YOLO26 模型导出为 ONNX 时,你可能会遇到常见的诸如依赖项不匹配或不支持的算子等问题。排查这些问题的方法:

  1. 验证你是否安装了正确版本的必需依赖项。
  2. 查看官方 ONNX 文档 以了解支持的算子和功能。
  3. 查看错误消息以获取线索,并查阅 Ultralytics 常见问题指南
  4. 尝试使用不同的导出参数,例如 simplify=True 或调整 opset 版本。
  5. 对于动态输入大小问题,在导出时设置 dynamic=True

如果问题仍然存在,请联系 Ultralytics 支持团队以获取进一步协助。

评论