Link to this sectionComment exporter des modèles PyTorch non-YOLO avec Ultralytics#
Déployer des modèles PyTorch en production implique généralement de jongler avec un exportateur différent pour chaque cible : torch.onnx.export pour ONNX, coremltools pour les appareils Apple, onnx2tf pour TensorFlow, pnnx pour NCNN, etc. Chaque outil possède sa propre API, ses spécificités de dépendances et ses conventions de sortie.
Ultralytics propose des utilitaires d'exportation autonomes qui regroupent plusieurs backends derrière une interface cohérente. Tu peux exporter n'importe quel torch.nn.Module, y compris des modèles d'image timm, des classificateurs et détecteurs torchvision, ou tes propres architectures personnalisées, vers ONNX, TorchScript, OpenVINO, CoreML, NCNN, PaddlePaddle, MNN, ExecuTorch et TensorFlow SavedModel sans avoir à apprendre chaque backend séparément.
Link to this sectionPourquoi utiliser Ultralytics pour l'exportation non-YOLO ?#
- Une API unique pour 10 formats : apprends une seule convention d'appel au lieu d'une douzaine.
- Surface utilitaire partagée : les assistants d'exportation se trouvent sous
ultralytics.utils.export, donc une fois les packages backend installés, tu peux conserver le même modèle d'appel entre les différents formats. - Même chemin de code que pour les exports YOLO : les mêmes assistants alimentent chaque exportation YOLO d'Ultralytics.
- Quantification FP16 et INT8 intégrée pour les formats qui la prennent en charge (OpenVINO, CoreML, MNN, NCNN).
- Fonctionne sur CPU : aucun GPU requis pour l'étape d'exportation elle-même, tu peux donc l'exécuter localement sur n'importe quel ordinateur portable.
Link to this sectionDémarrage rapide#
Le chemin le plus rapide est une exportation en deux lignes vers ONNX sans code YOLO et sans configuration autre que pip install ultralytics onnx timm :
import timm
import torch
from ultralytics.utils.export import torch2onnx
model = timm.create_model("resnet18", pretrained=True).eval()
torch2onnx(model, torch.randn(1, 3, 224, 224), output_file="resnet18.onnx")Link to this sectionFormats d'exportation pris en charge#
Les fonctions torch2* prennent un torch.nn.Module standard et un tenseur d'entrée exemple. MNN, TF SavedModel et TF Frozen Graph passent par un artefact intermédiaire ONNX ou Keras. Aucun attribut spécifique à YOLO n'est requis dans aucun des cas.
| Format | Fonction | Installation | Sortie |
|---|---|---|---|
| ONNX | torch2onnx() | pip install onnx | fichier .onnx |
| TorchScript | torch2torchscript() | inclus avec PyTorch | fichier .torchscript |
| OpenVINO | torch2openvino() | pip install openvino | répertoire _openvino_model/ |
| CoreML | torch2coreml() | pip install coremltools | .mlpackage |
| TF SavedModel | onnx2saved_model() | voir les exigences détaillées ci-dessous | répertoire _saved_model/ |
| TF Frozen Graph | keras2pb() | voir les exigences détaillées ci-dessous | fichier .pb |
| NCNN | torch2ncnn() | pip install ncnn pnnx | répertoire _ncnn_model/ |
| MNN | onnx2mnn() | pip install MNN | fichier .mnn |
| PaddlePaddle | torch2paddle() | pip install paddlepaddle x2paddle | répertoire _paddle_model/ |
| ExecuTorch | torch2executorch() | pip install executorch | répertoire _executorch_model/ |
Les exportations MNN, TF SavedModel et TF Frozen Graph passent par ONNX comme étape intermédiaire. Exporte d'abord vers ONNX, puis convertis.
Plusieurs fonctions d'exportation acceptent un dictionnaire metadata optionnel (ex: torch2torchscript(..., metadata={"author": "me"})) qui intègre des paires clé-valeur personnalisées dans l'artefact exporté, lorsque le format le permet.
Link to this sectionExemples étape par étape#
Chaque exemple ci-dessous utilise la même configuration, un ResNet-18 pré-entraîné issu de timm en mode évaluation :
import timm
import torch
model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)Le Dropout, la batch normalization et d'autres couches spécifiques à l'entraînement se comportent différemment lors de l'inférence. Omettre .eval() produit des exports avec des sorties incorrectes.
Link to this sectionExporter vers ONNX#
from ultralytics.utils.export import torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")Pour une taille de batch dynamique, passe un dictionnaire dynamic :
torch2onnx(model, im, output_file="resnet18_dyn.onnx", dynamic={"images": {0: "batch_size"}})L'opset par défaut est 14 et le nom d'entrée par défaut est "images". Outrepasse-les avec les arguments opset, input_names ou output_names.
Link to this sectionExporter vers TorchScript#
Aucune dépendance supplémentaire nécessaire. Utilise torch.jit.trace en arrière-plan.
from ultralytics.utils.export import torch2torchscript
torch2torchscript(model, im, output_file="resnet18.torchscript")Link to this sectionExporter vers OpenVINO#
from ultralytics.utils.export import torch2openvino
ov_model = torch2openvino(model, im, output_dir="resnet18_openvino_model")Le répertoire contient une paire model.xml et model.bin au nom fixe :
resnet18_openvino_model/
├── model.xml
└── model.binPasse dynamic=True pour des formes d'entrée dynamiques, half=True pour le FP16, ou int8=True pour la quantification INT8. L'INT8 nécessite en plus un argument calibration_dataset.
Nécessite openvino>=2024.0.0 (ou >=2025.2.0 sur macOS 15.4+) et torch>=2.1.
Link to this sectionExporter vers CoreML#
import coremltools as ct
from ultralytics.utils.export import torch2coreml
inputs = [ct.TensorType("input", shape=(1, 3, 224, 224))]
ct_model = torch2coreml(model, inputs, im, output_file="resnet18.mlpackage")Pour les modèles de classification, passe une liste de noms de classes à classifier_names pour ajouter une tête de classification au modèle CoreML.
Nécessite coremltools>=9.0, torch>=1.11 et numpy<=2.3.5. Non pris en charge sur Windows.
coremltools>=9.0 fournit des wheels pour Python 3.10–3.13 sur macOS et Linux. Sur les versions plus récentes de Python, l'extension native en C échoue au chargement. Utilise Python 3.10–3.13 pour l'exportation CoreML.
Link to this sectionExporter vers TensorFlow SavedModel#
L'exportation TF SavedModel passe par ONNX comme étape intermédiaire :
from ultralytics.utils.export import onnx2saved_model, torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")
keras_model = onnx2saved_model("resnet18.onnx", output_dir="resnet18_saved_model")La fonction renvoie un modèle Keras et génère également des fichiers TFLite (.tflite) dans le répertoire de sortie :
resnet18_saved_model/
├── saved_model.pb
├── variables/
├── resnet18_float32.tflite
├── resnet18_float16.tflite
└── resnet18_int8.tfliteExigences :
tensorflow>=2.0.0,<=2.19.0onnx2tf>=1.26.3,<1.29.0tf_keras<=2.19.0sng4onnx>=1.0.1onnx_graphsurgeon>=0.3.26(installe avec--extra-index-url https://pypi.ngc.nvidia.com)ai-edge-litert>=1.2.0,<1.4.0sur macOS (ai-edge-litert>=1.2.0sur les autres plateformes)onnxslim>=0.1.71onnx>=1.12.0,<2.0.0protobuf>=5
Link to this sectionExporter vers TensorFlow Frozen Graph#
En poursuivant depuis l'exportation SavedModel ci-dessus, convertis le modèle Keras renvoyé en un graphe .pb figé :
from pathlib import Path
from ultralytics.utils.export import keras2pb
keras2pb(keras_model, output_file=Path("resnet18_saved_model/resnet18.pb"))Link to this sectionExporter vers NCNN#
from ultralytics.utils.export import torch2ncnn
torch2ncnn(model, im, output_dir="resnet18_ncnn_model")Le répertoire contient des fichiers param et bin à nom fixe ainsi qu'un wrapper Python :
resnet18_ncnn_model/
├── model.ncnn.param
├── model.ncnn.bin
└── model_ncnn.pytorch2ncnn() vérifie la présence de ncnn et pnnx lors de la première utilisation.
Link to this sectionExporter vers MNN#
L'exportation MNN nécessite un fichier ONNX en entrée. Exporte d'abord vers ONNX, puis convertis :
from ultralytics.utils.export import onnx2mnn, torch2onnx
torch2onnx(model, im, output_file="resnet18.onnx")
onnx2mnn("resnet18.onnx", output_file="resnet18.mnn")Prend en charge half=True pour le FP16 et int8=True pour la quantification INT8. Nécessite MNN>=2.9.6 et torch>=1.10.
Link to this sectionExporter vers PaddlePaddle#
from ultralytics.utils.export import torch2paddle
torch2paddle(model, im, output_dir="resnet18_paddle_model")Le répertoire contient le modèle PaddlePaddle et les fichiers de paramètres :
resnet18_paddle_model/
├── model.pdmodel
└── model.pdiparamsNécessite x2paddle et la distribution PaddlePaddle correcte pour ta plateforme :
paddlepaddle-gpu>=3.0.0,<3.3.0sur CUDApaddlepaddle==3.0.0sur CPU ARM64paddlepaddle>=3.0.0,<3.3.0sur les autres CPU
Non pris en charge sur NVIDIA Jetson.
Link to this sectionExporter vers ExecuTorch#
from ultralytics.utils.export import torch2executorch
torch2executorch(model, im, output_dir="resnet18_executorch_model")Le fichier .pte exporté est enregistré dans le répertoire de sortie :
resnet18_executorch_model/
└── model.pteNécessite torch>=2.9.0 et un runtime ExecuTorch correspondant (pip install executorch). Pour l'utilisation du runtime, consulte l'intégration ExecuTorch.
Link to this sectionVérifie ton modèle exporté#
Après l'exportation, vérifie la parité numérique avec le modèle PyTorch original avant le déploiement. Un test rapide avec ONNXBackend provenant de ultralytics.nn.backends compare les sorties et signale rapidement les erreurs de traçage ou de quantification :
import numpy as np
import timm
import torch
from ultralytics.nn.backends import ONNXBackend
model = timm.create_model("resnet18", pretrained=True).eval()
im = torch.randn(1, 3, 224, 224)
with torch.no_grad():
pytorch_output = model(im).numpy()
onnx_model = ONNXBackend("resnet18.onnx", device=torch.device("cpu"))
onnx_output = onnx_model(im)[0]
diff = np.abs(pytorch_output - onnx_output).max()
print(f"Max difference: {diff:.6f}") # should be < 1e-5Pour les exportations FP32, la différence absolue maximale doit être inférieure à 1e-5. Des différences plus grandes indiquent des opérations non prises en charge, une forme d'entrée incorrecte ou un modèle qui n'est pas en mode évaluation. Les exportations FP16 et INT8 ont des tolérances plus larges. Valide sur des données réelles plutôt que sur des tenseurs aléatoires.
Pour d'autres runtimes, le nom du tenseur d'entrée peut différer. OpenVINO, par exemple, utilise le nom de l'argument forward du modèle (généralement x pour les modèles génériques), tandis que torch2onnx utilise par défaut "images".
Link to this sectionLimitations connues#
- La prise en charge des entrées multiples est inégale :
torch2onnxettorch2openvinoacceptent un tuple ou une liste de tenseurs d'exemple pour les modèles à entrées multiples.torch2torchscript,torch2coreml,torch2ncnn,torch2paddleettorch2executorchsupposent un tenseur d'entrée unique. - ExecuTorch a besoin de
flatc: Le runtime ExecuTorch nécessite le compilateur FlatBuffers. Installe-le avecbrew install flatbufferssur macOS ouapt install flatbuffers-compilersur Ubuntu. - Pas d'inférence via Ultralytics : Les modèles non-YOLO exportés ne peuvent pas être rechargés via
YOLO()pour l'inférence. Utilise le runtime natif pour chaque format (ONNX Runtime, OpenVINO Runtime, etc.). - Formats réservés à YOLO : Les exportations Axelera et Sony IMX500 nécessitent des attributs de modèle spécifiques à YOLO et ne sont pas disponibles pour les modèles génériques.
- Formats spécifiques à une plateforme : TensorRT nécessite un GPU NVIDIA. RKNN nécessite le SDK
rknn-toolkit2(Linux uniquement). Edge TPU nécessite le binaireedgetpu_compiler(Linux uniquement).
Link to this sectionFAQ#
Link to this sectionQuels modèles puis-je exporter avec Ultralytics ?#
N'importe quel torch.nn.Module. Cela inclut les modèles de timm, torchvision ou tout modèle PyTorch personnalisé. Le modèle doit être en mode évaluation (model.eval()) avant l'exportation. ONNX et OpenVINO acceptent de plus un tuple de tenseurs d'exemple pour les modèles à entrées multiples.
Link to this sectionQuels formats d'exportation fonctionnent sans GPU ?#
Tous les formats pris en charge (TorchScript, ONNX, OpenVINO, CoreML, TF SavedModel, TF Frozen Graph, NCNN, PaddlePaddle, MNN, ExecuTorch) peuvent être exportés sur CPU. Aucun GPU n'est requis pour le processus d'exportation lui-même. TensorRT est le seul format qui nécessite un GPU NVIDIA.
Link to this sectionQuelle version d'Ultralytics dois-je utiliser ?#
Utilise Ultralytics >=8.4.38, qui inclut le module ultralytics.utils.export et les arguments standardisés output_file/output_dir.
Link to this sectionPuis-je exporter un modèle torchvision vers CoreML pour un déploiement iOS ?#
Oui. Les classifieurs, détecteurs et modèles de segmentation torchvision s'exportent au format .mlpackage via torch2coreml. Pour les modèles de classification d'images, passe une liste de noms de classes à classifier_names pour intégrer une tête de classification. Effectue l'exportation sur macOS ou Linux. CoreML n'est pas pris en charge sur Windows. Consulte l'intégration CoreML pour les détails sur le déploiement iOS.
Link to this sectionPuis-je quantifier mon modèle exporté en INT8 ou FP16 ?#
Oui, pour plusieurs formats. Passe half=True pour FP16 ou int8=True pour INT8 lors de l'exportation vers OpenVINO, CoreML, MNN ou NCNN. L'INT8 dans OpenVINO nécessite en plus un argument calibration_dataset pour la quantification post-entraînement. Consulte la page d'intégration de chaque format pour connaître les compromis de la quantification.