Link to this sectionComment exporter des modèles PyTorch non-YOLO avec Ultralytics#

Q: Quels modèles puis-je exporter avec Ultralytics ?

N'importe quel torch.nn.Module. Cela inclut les modèles de timm, torchvision ou tout modèle PyTorch personnalisé. Le modèle doit être en mode évaluation (model.eval()) avant l'exportation. ONNX et OpenVINO acceptent de plus un tuple de tenseurs d'exemple pour les modèles à entrées multiples.

Q: Quelle version d'Ultralytics dois-je utiliser ?

Utilise Ultralytics >=8.4.38, qui inclut le module ultralytics.utils.export et les arguments standardisés output_file/output_dir.

Q: Puis-je quantifier mon modèle exporté en INT8 ou FP16 ?

Oui, pour plusieurs formats. Passe half=True pour FP16 ou int8=True pour INT8 lors de l'exportation vers OpenVINO, CoreML, MNN ou NCNN. L'INT8 dans OpenVINO nécessite en plus un argument calibration_dataset pour la quantification post-entraînement. Consulte la page d'intégration de chaque format pour connaître les compromis de la quantification.

Déployer des modèles PyTorch en production implique généralement de jongler avec un exportateur différent pour chaque cible : torch.onnx.export pour ONNX, coremltools pour les appareils Apple, onnx2tf pour TensorFlow, pnnx pour NCNN, etc. Chaque outil possède sa propre API, ses spécificités de dépendances et ses conventions de sortie.

Ultralytics propose des utilitaires d'exportation autonomes qui regroupent plusieurs backends derrière une interface cohérente. Tu peux exporter n'importe quel torch.nn.Module, y compris des modèles d'image timm, des classificateurs et détecteurs torchvision, ou tes propres architectures personnalisées, vers ONNX, TorchScript, OpenVINO, CoreML, NCNN, PaddlePaddle, MNN, ExecuTorch et TensorFlow SavedModel sans avoir à apprendre chaque backend séparément.

Link to this sectionPourquoi utiliser Ultralytics pour l'exportation non-YOLO ?#

Une API unique pour 10 formats : apprends une seule convention d'appel au lieu d'une douzaine.
Surface utilitaire partagée : les assistants d'exportation se trouvent sous ultralytics.utils.export, donc une fois les packages backend installés, tu peux conserver le même modèle d'appel entre les différents formats.
Même chemin de code que pour les exports YOLO : les mêmes assistants alimentent chaque exportation YOLO d'Ultralytics.
Quantification FP16 et INT8 intégrée pour les formats qui la prennent en charge (OpenVINO, CoreML, MNN, NCNN).
Fonctionne sur CPU : aucun GPU requis pour l'étape d'exportation elle-même, tu peux donc l'exécuter localement sur n'importe quel ordinateur portable.

Link to this sectionDémarrage rapide#

Le chemin le plus rapide est une exportation en deux lignes vers ONNX sans code YOLO et sans configuration autre que pip install ultralytics onnx timm :

import timm
import torch

from ultralytics.utils.export import torch2onnx

model = timm.create_model("resnet18", pretrained=True).eval()
torch2onnx(model, torch.randn(1, 3, 224, 224), output_file="resnet18.onnx")

Link to this sectionFormats d'exportation pris en charge#

Les fonctions torch2* prennent un torch.nn.Module standard et un tenseur d'entrée exemple. MNN, TF SavedModel et TF Frozen Graph passent par un artefact intermédiaire ONNX ou Keras. Aucun attribut spécifique à YOLO n'est requis dans aucun des cas.

Format	Fonction	Installation	Sortie
ONNX	`torch2onnx()`	`pip install onnx`	fichier `.onnx`
TorchScript	`torch2torchscript()`	inclus avec PyTorch	fichier `.torchscript`
OpenVINO	`torch2openvino()`	`pip install openvino`	répertoire `_openvino_model/`
CoreML	`torch2coreml()`	`pip install coremltools`	`.mlpackage`
TF SavedModel	`onnx2saved_model()`	voir les exigences détaillées ci-dessous	répertoire `_saved_model/`
TF Frozen Graph	`keras2pb()`	voir les exigences détaillées ci-dessous	fichier `.pb`
NCNN	`torch2ncnn()`	`pip install ncnn pnnx`	répertoire `_ncnn_model/`
MNN	`onnx2mnn()`	`pip install MNN`	fichier `.mnn`
PaddlePaddle	`torch2paddle()`	`pip install paddlepaddle x2paddle`	répertoire `_paddle_model/`
ExecuTorch	`torch2executorch()`	`pip install executorch`	répertoire `_executorch_model/`

ONNX comme format intermédiaire

Les exportations MNN, TF SavedModel et TF Frozen Graph passent par ONNX comme étape intermédiaire. Exporte d'abord vers ONNX, puis convertis.

Intégration de métadonnées

Plusieurs fonctions d'exportation acceptent un dictionnaire metadata optionnel (ex: torch2torchscript(..., metadata={"author": "me"})) qui intègre des paires clé-valeur personnalisées dans l'artefact exporté, lorsque le format le permet.

Link to this sectionExemples étape par étape#

Chaque exemple ci-dessous utilise la même configuration, un ResNet-18 pré-entraîné issu de timm en mode évaluation :

import timm
import torch

model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)

Appelle toujours `model.eval()` avant d'exporter

Le Dropout, la batch normalization et d'autres couches spécifiques à l'entraînement se comportent différemment lors de l'inférence. Omettre .eval() produit des exports avec des sorties incorrectes.

Link to this sectionExporter vers ONNX#

from ultralytics.utils.export import torch2onnx

torch2onnx(model, im, output_file="resnet18.onnx")

Pour une taille de batch dynamique, passe un dictionnaire dynamic :

torch2onnx(model, im, output_file="resnet18_dyn.onnx", dynamic={"images": {0: "batch_size"}})

L'opset par défaut est 14 et le nom d'entrée par défaut est "images". Outrepasse-les avec les arguments opset, input_names ou output_names.

Link to this sectionExporter vers TorchScript#

Aucune dépendance supplémentaire nécessaire. Utilise torch.jit.trace en arrière-plan.

from ultralytics.utils.export import torch2torchscript

torch2torchscript(model, im, output_file="resnet18.torchscript")

Link to this sectionExporter vers OpenVINO#

from ultralytics.utils.export import torch2openvino

ov_model = torch2openvino(model, im, output_dir="resnet18_openvino_model")

Le répertoire contient une paire model.xml et model.bin au nom fixe :

resnet18_openvino_model/
├── model.xml
└── model.bin

Passe dynamic=True pour des formes d'entrée dynamiques, half=True pour le FP16, ou int8=True pour la quantification INT8. L'INT8 nécessite en plus un argument calibration_dataset.

Nécessite openvino>=2024.0.0 (ou >=2025.2.0 sur macOS 15.4+) et torch>=2.1.

Link to this sectionExporter vers CoreML#

import coremltools as ct

from ultralytics.utils.export import torch2coreml

inputs = [ct.TensorType("input", shape=(1, 3, 224, 224))]
ct_model = torch2coreml(model, inputs, im, output_file="resnet18.mlpackage")

Pour les modèles de classification, passe une liste de noms de classes à classifier_names pour ajouter une tête de classification au modèle CoreML.

Nécessite coremltools>=9.0, torch>=1.11 et numpy<=2.3.5. Non pris en charge sur Windows.

Erreur `BlobWriter not loaded`

coremltools>=9.0 fournit des wheels pour Python 3.10–3.13 sur macOS et Linux. Sur les versions plus récentes de Python, l'extension native en C échoue au chargement. Utilise Python 3.10–3.13 pour l'exportation CoreML.

Link to this sectionExporter vers TensorFlow SavedModel#

L'exportation TF SavedModel passe par ONNX comme étape intermédiaire :

from ultralytics.utils.export import onnx2saved_model, torch2onnx

torch2onnx(model, im, output_file="resnet18.onnx")
keras_model = onnx2saved_model("resnet18.onnx", output_dir="resnet18_saved_model")

La fonction renvoie un modèle Keras et génère également des fichiers TFLite (.tflite) dans le répertoire de sortie :

resnet18_saved_model/
├── saved_model.pb
├── variables/
├── resnet18_float32.tflite
├── resnet18_float16.tflite
└── resnet18_int8.tflite

Exigences :

tensorflow>=2.0.0,<=2.19.0
onnx2tf>=1.26.3,<1.29.0
tf_keras<=2.19.0
sng4onnx>=1.0.1
onnx_graphsurgeon>=0.3.26 (installe avec --extra-index-url https://pypi.ngc.nvidia.com)
ai-edge-litert>=1.2.0,<1.4.0 sur macOS (ai-edge-litert>=1.2.0 sur les autres plateformes)
onnxslim>=0.1.71
onnx>=1.12.0,<2.0.0
protobuf>=5

Link to this sectionExporter vers TensorFlow Frozen Graph#

En poursuivant depuis l'exportation SavedModel ci-dessus, convertis le modèle Keras renvoyé en un graphe .pb figé :

from pathlib import Path

from ultralytics.utils.export import keras2pb

keras2pb(keras_model, output_file=Path("resnet18_saved_model/resnet18.pb"))

Link to this sectionExporter vers NCNN#

from ultralytics.utils.export import torch2ncnn

torch2ncnn(model, im, output_dir="resnet18_ncnn_model")

Le répertoire contient des fichiers param et bin à nom fixe ainsi qu'un wrapper Python :

resnet18_ncnn_model/
├── model.ncnn.param
├── model.ncnn.bin
└── model_ncnn.py

torch2ncnn() vérifie la présence de ncnn et pnnx lors de la première utilisation.

Link to this sectionExporter vers MNN#

L'exportation MNN nécessite un fichier ONNX en entrée. Exporte d'abord vers ONNX, puis convertis :

from ultralytics.utils.export import onnx2mnn, torch2onnx

torch2onnx(model, im, output_file="resnet18.onnx")
onnx2mnn("resnet18.onnx", output_file="resnet18.mnn")

Prend en charge half=True pour le FP16 et int8=True pour la quantification INT8. Nécessite MNN>=2.9.6 et torch>=1.10.

Link to this sectionExporter vers PaddlePaddle#

from ultralytics.utils.export import torch2paddle

torch2paddle(model, im, output_dir="resnet18_paddle_model")

Le répertoire contient le modèle PaddlePaddle et les fichiers de paramètres :

resnet18_paddle_model/
├── model.pdmodel
└── model.pdiparams

Nécessite x2paddle et la distribution PaddlePaddle correcte pour ta plateforme :

paddlepaddle-gpu>=3.0.0,<3.3.0 sur CUDA
paddlepaddle==3.0.0 sur CPU ARM64
paddlepaddle>=3.0.0,<3.3.0 sur les autres CPU

Non pris en charge sur NVIDIA Jetson.

Link to this sectionExporter vers ExecuTorch#

from ultralytics.utils.export import torch2executorch

torch2executorch(model, im, output_dir="resnet18_executorch_model")

Le fichier .pte exporté est enregistré dans le répertoire de sortie :

resnet18_executorch_model/
└── model.pte

Nécessite torch>=2.9.0 et un runtime ExecuTorch correspondant (pip install executorch). Pour l'utilisation du runtime, consulte l'intégration ExecuTorch.

Link to this sectionVérifie ton modèle exporté#

Après l'exportation, vérifie la parité numérique avec le modèle PyTorch original avant le déploiement. Un test rapide avec ONNXBackend provenant de ultralytics.nn.backends compare les sorties et signale rapidement les erreurs de traçage ou de quantification :

import numpy as np
import timm
import torch

from ultralytics.nn.backends import ONNXBackend

model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)
with torch.no_grad():
    pytorch_output = model(im).numpy()

onnx_model = ONNXBackend("resnet18.onnx", device=torch.device("cpu"))
onnx_output = onnx_model(im)[0]

diff = np.abs(pytorch_output - onnx_output).max()
print(f"Max difference: {diff:.6f}")  # should be < 1e-5

Différence attendue

Pour les exportations FP32, la différence absolue maximale doit être inférieure à 1e-5. Des différences plus grandes indiquent des opérations non prises en charge, une forme d'entrée incorrecte ou un modèle qui n'est pas en mode évaluation. Les exportations FP16 et INT8 ont des tolérances plus larges. Valide sur des données réelles plutôt que sur des tenseurs aléatoires.

Pour d'autres runtimes, le nom du tenseur d'entrée peut différer. OpenVINO, par exemple, utilise le nom de l'argument forward du modèle (généralement x pour les modèles génériques), tandis que torch2onnx utilise par défaut "images".

Link to this sectionLimitations connues#

La prise en charge des entrées multiples est inégale : torch2onnx et torch2openvino acceptent un tuple ou une liste de tenseurs d'exemple pour les modèles à entrées multiples. torch2torchscript, torch2coreml, torch2ncnn, torch2paddle et torch2executorch supposent un tenseur d'entrée unique.
ExecuTorch a besoin de flatc : Le runtime ExecuTorch nécessite le compilateur FlatBuffers. Installe-le avec brew install flatbuffers sur macOS ou apt install flatbuffers-compiler sur Ubuntu.
Pas d'inférence via Ultralytics : Les modèles non-YOLO exportés ne peuvent pas être rechargés via YOLO() pour l'inférence. Utilise le runtime natif pour chaque format (ONNX Runtime, OpenVINO Runtime, etc.).
Formats réservés à YOLO : Les exportations Axelera et Sony IMX500 nécessitent des attributs de modèle spécifiques à YOLO et ne sont pas disponibles pour les modèles génériques.
Formats spécifiques à une plateforme : TensorRT nécessite un GPU NVIDIA. RKNN nécessite le SDK rknn-toolkit2 (Linux uniquement). Edge TPU nécessite le binaire edgetpu_compiler (Linux uniquement).

Link to this sectionFAQ#

Link to this sectionQuels modèles puis-je exporter avec Ultralytics ?#

N'importe quel torch.nn.Module. Cela inclut les modèles de timm, torchvision ou tout modèle PyTorch personnalisé. Le modèle doit être en mode évaluation (model.eval()) avant l'exportation. ONNX et OpenVINO acceptent de plus un tuple de tenseurs d'exemple pour les modèles à entrées multiples.

Link to this sectionQuels formats d'exportation fonctionnent sans GPU ?#

Tous les formats pris en charge (TorchScript, ONNX, OpenVINO, CoreML, TF SavedModel, TF Frozen Graph, NCNN, PaddlePaddle, MNN, ExecuTorch) peuvent être exportés sur CPU. Aucun GPU n'est requis pour le processus d'exportation lui-même. TensorRT est le seul format qui nécessite un GPU NVIDIA.

Link to this sectionQuelle version d'Ultralytics dois-je utiliser ?#

Utilise Ultralytics >=8.4.38, qui inclut le module ultralytics.utils.export et les arguments standardisés output_file/output_dir.

Link to this sectionPuis-je exporter un modèle torchvision vers CoreML pour un déploiement iOS ?#

Oui. Les classifieurs, détecteurs et modèles de segmentation torchvision s'exportent au format .mlpackage via torch2coreml. Pour les modèles de classification d'images, passe une liste de noms de classes à classifier_names pour intégrer une tête de classification. Effectue l'exportation sur macOS ou Linux. CoreML n'est pas pris en charge sur Windows. Consulte l'intégration CoreML pour les détails sur le déploiement iOS.

Link to this sectionPuis-je quantifier mon modèle exporté en INT8 ou FP16 ?#

Oui, pour plusieurs formats. Passe half=True pour FP16 ou int8=True pour INT8 lors de l'exportation vers OpenVINO, CoreML, MNN ou NCNN. L'INT8 dans OpenVINO nécessite en plus un argument calibration_dataset pour la quantification post-entraînement. Consulte la page d'intégration de chaque format pour connaître les compromis de la quantification.

Contributors

GLglenn-jocher² LALaughing-q¹ RAraimbekovm¹

Created le mois dernierUpdated il y a 2 semaines