Link to this section如何使用 Ultralytics 导出非 YOLO PyTorch 模型#
将 PyTorch 模型部署到生产环境通常意味着要为每个目标平台应付不同的导出工具:用于 ONNX 的 torch.onnx.export,用于 Apple 设备的 coremltools,用于 TensorFlow 的 onnx2tf,用于 NCNN 的 pnnx 等。每个工具都有自己的 API、依赖项特性和输出约定。
Ultralytics 提供了独立的导出工具,在一个统一的接口下封装了多种后端。你可以将任何 torch.nn.Module(包括 timm 图像模型、torchvision 分类器和检测器,或你自己的自定义架构)导出为 ONNX、TorchScript、OpenVINO、CoreML、NCNN、PaddlePaddle、MNN、ExecuTorch 和 TensorFlow SavedModel,而无需分别学习每个后端。
Link to this section为什么要使用 Ultralytics 进行非 YOLO 模型导出?#
- 跨 10 种格式的统一 API: 只需学习一种调用约定,无需学习十几种。
- 共享工具界面: 导出辅助函数位于
ultralytics.utils.export下,因此一旦安装了后端软件包,你就可以在不同格式之间保持相同的调用模式。 - 与 YOLO 导出相同的代码路径: 相同的辅助函数驱动着每一个 Ultralytics YOLO 导出。
- 内置 FP16 和 INT8 量化功能(适用于支持这些格式的后端,如 OpenVINO、CoreML、MNN、NCNN)。
- 可在 CPU 上运行: 导出步骤本身不需要 GPU,因此你可以在任何笔记本电脑上本地运行它。
Link to this section快速入门#
最快路径是两行代码导出到 ONNX,无需 YOLO 代码,除了 pip install ultralytics onnx timm 外无需其他设置:
import timm
import torch
from ultralytics.utils.export import torch2onnx
model = timm.create_model("resnet18", pretrained=True).eval()
torch2onnx(model, torch.randn(1, 3, 224, 224), output_file="resnet18.onnx")Link to this section支持的导出格式#
torch2* 函数接受标准的 torch.nn.Module 和示例输入张量。MNN、TF SavedModel 和 TF Frozen Graph 通过中间的 ONNX 或 Keras 工件进行处理。在这两种情况下,都不需要任何 YOLO 特定的属性。
| 格式 | 函数 | 安装 | 输出 |
|---|---|---|---|
| ONNX | torch2onnx() | pip install onnx | .onnx 文件 |
| TorchScript | torch2torchscript() | 包含在 PyTorch 中 | .torchscript 文件 |
| OpenVINO | torch2openvino() | pip install openvino | _openvino_model/ 目录 |
| CoreML | torch2coreml() | pip install coremltools | .mlpackage |
| TF SavedModel | onnx2saved_model() | 见下方详细要求 | _saved_model/ 目录 |
| TF Frozen Graph | keras2pb() | 见下方详细要求 | .pb 文件 |
| NCNN | torch2ncnn() | pip install ncnn pnnx | _ncnn_model/ 目录 |
| MNN | onnx2mnn() | pip install MNN | .mnn 文件 |
| PaddlePaddle | torch2paddle() | pip install paddlepaddle x2paddle | _paddle_model/ 目录 |
| ExecuTorch | torch2executorch() | pip install executorch | _executorch_model/ 目录 |
MNN、TF SavedModel 和 TF Frozen Graph 的导出需经过 ONNX 作为中间步骤。请先导出为 ONNX,然后再进行转换。
一些导出函数接受一个可选的 metadata 字典(例如 torch2torchscript(..., metadata={"author": "me"})),如果格式支持,它会将自定义键值对嵌入到导出的工件中。
Link to this section分步示例#
下面的每个示例都使用相同的设置,即一个来自 timm 的预训练 ResNet-18(处于评估模式):
import timm
import torch
model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)Dropout、批归一化 以及其他仅在训练时使用的层在推理时的行为不同。跳过 .eval() 会导致导出的模型输出错误。
Link to this section导出为 ONNX#
from ultralytics.utils.export import torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")对于动态批次大小,请传递一个 dynamic 字典:
torch2onnx(model, im, output_file="resnet18_dyn.onnx", dynamic={"images": {0: "batch_size"}})默认的 opset 为 14,默认输入名称为 "images"。你可以使用 opset、input_names 或 output_names 参数进行覆盖。
Link to this section导出到 TorchScript#
无需额外依赖。底层使用 torch.jit.trace。
from ultralytics.utils.export import torch2torchscript
torch2torchscript(model, im, output_file="resnet18.torchscript")Link to this section导出到 OpenVINO#
from ultralytics.utils.export import torch2openvino
ov_model = torch2openvino(model, im, output_dir="resnet18_openvino_model")该目录包含一对固定名称的 model.xml 和 model.bin 文件:
resnet18_openvino_model/
├── model.xml
└── model.bin传递 dynamic=True 可获得动态输入形状,half=True 可获得 FP16,或 int8=True 可进行 INT8 量化。INT8 还需要额外的 calibration_dataset 参数。
需要 openvino>=2024.0.0(在 macOS 15.4+ 上需要 >=2025.2.0)和 torch>=2.1。
Link to this section导出到 CoreML#
import coremltools as ct
from ultralytics.utils.export import torch2coreml
inputs = [ct.TensorType("input", shape=(1, 3, 224, 224))]
ct_model = torch2coreml(model, inputs, im, output_file="resnet18.mlpackage")对于 分类 模型,将类别名称列表传递给 classifier_names,以便向 CoreML 模型添加分类头。
需要 coremltools>=9.0、torch>=1.11 和 numpy<=2.3.5。Windows 不支持此功能。
coremltools>=9.0 为 macOS 和 Linux 上的 Python 3.10–3.13 提供了二进制安装包(wheels)。在较新的 Python 版本上,原生 C 扩展无法加载。请使用 Python 3.10–3.13 进行 CoreML 导出。
Link to this section导出到 TensorFlow SavedModel#
TF SavedModel 导出通过 ONNX 作为中间步骤进行:
from ultralytics.utils.export import onnx2saved_model, torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")
keras_model = onnx2saved_model("resnet18.onnx", output_dir="resnet18_saved_model")该函数返回一个 Keras 模型,并会在输出目录内生成 TFLite 文件 (.tflite):
resnet18_saved_model/
├── saved_model.pb
├── variables/
├── resnet18_float32.tflite
├── resnet18_float16.tflite
└── resnet18_int8.tflite要求:
tensorflow>=2.0.0,<=2.19.0onnx2tf>=1.26.3,<1.29.0tf_keras<=2.19.0sng4onnx>=1.0.1onnx_graphsurgeon>=0.3.26(使用--extra-index-url https://pypi.ngc.nvidia.com进行安装)- macOS 上使用
ai-edge-litert>=1.2.0,<1.4.0(其他平台使用ai-edge-litert>=1.2.0) onnxslim>=0.1.71onnx>=1.12.0,<2.0.0protobuf>=5
Link to this section导出到 TensorFlow Frozen Graph#
从上面的 SavedModel 导出继续,将返回的 Keras 模型转换为冻结的 .pb 图:
from pathlib import Path
from ultralytics.utils.export import keras2pb
keras2pb(keras_model, output_file=Path("resnet18_saved_model/resnet18.pb"))Link to this section导出到 NCNN#
from ultralytics.utils.export import torch2ncnn
torch2ncnn(model, im, output_dir="resnet18_ncnn_model")该目录包含固定名称的 param 和 bin 文件,以及一个 Python 包装器:
resnet18_ncnn_model/
├── model.ncnn.param
├── model.ncnn.bin
└── model_ncnn.pytorch2ncnn() 会在首次使用时检查 ncnn 和 pnnx 是否存在。
Link to this section导出到 MNN#
MNN 导出需要一个 ONNX 文件作为输入。请先导出为 ONNX,然后再进行转换:
from ultralytics.utils.export import onnx2mnn, torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")
onnx2mnn("resnet18.onnx", output_file="resnet18.mnn")支持 half=True 进行 FP16 和 int8=True 进行 INT8 量化。需要 MNN>=2.9.6 和 torch>=1.10。
Link to this section导出到 PaddlePaddle#
from ultralytics.utils.export import torch2paddle
torch2paddle(model, im, output_dir="resnet18_paddle_model")该目录包含 PaddlePaddle 模型和参数文件:
resnet18_paddle_model/
├── model.pdmodel
└── model.pdiparams需要 x2paddle 以及适合你平台的正确 PaddlePaddle 发行版:
- CUDA 上使用
paddlepaddle-gpu>=3.0.0,<3.3.0 - ARM64 CPU 上使用
paddlepaddle==3.0.0 - 其他 CPU 上使用
paddlepaddle>=3.0.0,<3.3.0
NVIDIA Jetson 不支持此功能。
Link to this section导出至 ExecuTorch#
from ultralytics.utils.export import torch2executorch
torch2executorch(model, im, output_dir="resnet18_executorch_model")导出的 .pte 文件保存在输出目录中:
resnet18_executorch_model/
└── model.pte需要 torch>=2.9.0 以及匹配的 ExecuTorch 运行时(使用 pip install executorch 安装)。有关运行时使用信息,请参阅 ExecuTorch 集成。
Link to this section验证你导出的模型#
After exporting, verify numerical parity with the original PyTorch model before shipping. A quick smoke test with ONNXBackend from ultralytics.nn.backends compares outputs and flags tracing or quantization errors early:
import numpy as np
import timm
import torch
from ultralytics.nn.backends import ONNXBackend
model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)
with torch.no_grad():
pytorch_output = model(im).numpy()
onnx_model = ONNXBackend("resnet18.onnx", device=torch.device("cpu"))
onnx_output = onnx_model(im)[0]
diff = np.abs(pytorch_output - onnx_output).max()
print(f"Max difference: {diff:.6f}") # should be < 1e-5对于 FP32 导出,最大绝对差异应低于 1e-5。较大的差异指向不支持的操作、错误的输入形状或模型未处于评估模式。FP16 和 INT8 导出的容差较宽。请在真实数据上而不是随机张量上进行验证。
对于其他运行时,输入张量名称可能不同。例如,OpenVINO 使用模型的前向参数名称(通用模型通常为 x),而 torch2onnx 默认为 "images"。
Link to this section已知限制#
- 多输入支持不均:
torch2onnx和torch2openvino接受用于多输入模型的示例张量元组或列表。torch2torchscript、torch2coreml、torch2ncnn、torch2paddle和torch2executorch假定仅有一个输入张量。 - ExecuTorch 需要
flatc:ExecuTorch 运行时需要 FlatBuffers 编译器。在 macOS 上使用brew install flatbuffers安装,在 Ubuntu 上使用apt install flatbuffers-compiler安装。 - 无法通过 Ultralytics 进行推理:导出的非 YOLO 模型无法重新加载到
YOLO()中进行推理。请为每种格式使用本机运行时(ONNX Runtime, OpenVINO Runtime 等)。 - 仅限 YOLO 的格式:Axelera 和 Sony IMX500 导出需要 YOLO 特定的模型属性,不适用于通用模型。
- 特定平台格式:TensorRT 需要 NVIDIA GPU。RKNN 需要
rknn-toolkit2SDK(仅限 Linux)。Edge TPU 需要edgetpu_compiler二进制文件(仅限 Linux)。
Link to this section常见问题 (FAQ)#
Link to this section我可以使用 Ultralytics 导出哪些模型?#
任何 torch.nn.Module。这包括来自 timm、torchvision 或任何自定义 PyTorch 模型。模型在导出前必须处于评估模式 (model.eval())。ONNX 和 OpenVINO 额外接受用于多输入模型的示例张量元组。
Link to this section哪些导出格式可以在没有 GPU 的情况下工作?#
所有支持的格式(TorchScript、ONNX、OpenVINO、CoreML、TF SavedModel、TF Frozen Graph、NCNN、PaddlePaddle、MNN、ExecuTorch)都可以在 CPU 上导出。导出过程本身不需要 GPU。TensorRT 是唯一需要 NVIDIA GPU 的格式。
Link to this section我需要什么版本的 Ultralytics?#
请使用 Ultralytics >=8.4.38,它包含了 ultralytics.utils.export 模块以及标准化的 output_file/output_dir 参数。
Link to this section我可以将 torchvision 模型导出为 CoreML 以用于 iOS 部署吗?#
Yes. torchvision classifiers, detectors, and segmentation models export to .mlpackage via torch2coreml. For image classification models, pass a list of class names to classifier_names to bake in a classification head. Run the export on macOS or Linux. CoreML is not supported on Windows. See the CoreML integration for iOS deployment details.
Link to this section我可以将导出的模型量化为 INT8 或 FP16 吗?#
可以,适用于多种格式。在导出到 OpenVINO、CoreML、MNN 或 NCNN 时,传递 half=True 可用于 FP16,或传递 int8=True 可用于 INT8。OpenVINO 中的 INT8 额外需要一个 calibration_dataset 参数用于 训练后量化。请参阅每种格式的集成页面了解量化权衡。