Meet YOLO26: next-gen vision AI.

Link to this sectionExportation Intel OpenVINO#

OpenVINO Intel AI inference toolkit

Dans ce guide, nous couvrons l'exportation des modèles YOLO26 vers le format OpenVINO, qui peut offrir jusqu'à 3x d'accélération sur CPU, ainsi qu'une accélération de l'inférence YOLO sur le matériel GPU et NPU d'Intel.

OpenVINO, abréviation de Open Visual Inference & Neural Network Optimization toolkit, est une boîte à outils complète pour optimiser et déployer des modèles d'inférence IA. Bien que le nom contienne « Visual », OpenVINO prend également en charge diverses tâches supplémentaires, notamment le langage, l'audio, les séries temporelles, etc.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this sectionExemples d'utilisation#

Le format OpenVINO prend en charge les modes Export, Predict et Validate. Exporte ton modèle, puis charge le modèle exporté pour exécuter l'inférence ou valider sa précision sur un CPU Intel, un GPU intégré/dédié ou un NPU.

Export
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
Predict
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
Validate
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionArguments d'exportation#

ArgumentTypePar défautDescription
formatstr'openvino'Format cible pour le modèle exporté, définissant la compatibilité avec divers environnements de déploiement.
imgszint ou tuple640Desired image size for the model input. Can be an integer for square images or a tuple (height, width) for specific dimensions.
halfboolFalseActive la quantification FP16 (précision moitié), réduisant la taille du modèle et accélérant potentiellement l'inférence sur le matériel pris en charge.
int8boolFalseActive la quantification INT8, compressant davantage le modèle et accélérant l'inférence avec une perte de précision minimale, principalement pour les appareils de périphérie (edge devices).
dynamicboolFalseAutorise des tailles d'entrée dynamiques, améliorant la flexibilité dans la gestion des dimensions d'image variables.
nmsboolFalseAjoute la suppression non maximale (NMS), essentielle pour un post-traitement de détection précis et efficace.
batchint1Spécifie la taille d'inférence du lot du modèle exporté ou le nombre maximal d'images que le modèle exporté traitera simultanément en mode predict.
datastr'coco8.yaml'Chemin vers le fichier de configuration du dataset (par défaut : coco8.yaml), essentiel pour la quantification.
fractionfloat1.0Spécifie la fraction du dataset à utiliser pour le calibrage de la quantification INT8. Permet de calibrer sur un sous-ensemble du dataset complet, utile pour les expériences ou lorsque les ressources sont limitées. Si non spécifié avec INT8 activé, le dataset complet sera utilisé.

Pour plus de détails sur le processus d'exportation, consulte la page de documentation Ultralytics sur l'exportation.

Avertissement

OpenVINO™ est compatible avec la plupart des processeurs Intel®, mais pour garantir des performances optimales :

  1. Vérifie la compatibilité OpenVINO™ Vérifie si ta puce Intel® est officiellement prise en charge par OpenVINO™ en utilisant la liste de compatibilité d'Intel.

  2. Identifie ton accélérateur Détermine si ton processeur inclut un NPU (Neural Processing Unit) ou un GPU (GPU intégré) intégré en consultant le guide matériel d'Intel.

  3. Installe les derniers pilotes Si ta puce prend en charge un NPU ou un GPU mais qu'OpenVINO™ ne le détecte pas, tu devras peut-être installer ou mettre à jour les pilotes associés. Suis les instructions d'installation des pilotes pour activer l'accélération complète.

En suivant ces trois étapes, tu peux t'assurer qu'OpenVINO™ fonctionne de manière optimale sur ton matériel Intel®.

Link to this sectionAvantages d'OpenVINO#

  1. Performances : OpenVINO offre une inférence haute performance en utilisant la puissance des processeurs Intel, des GPU intégrés et dédiés, et des FPGA.
  2. Prise en charge de l'exécution hétérogène : OpenVINO fournit une API pour écrire une fois et déployer sur n'importe quel matériel Intel pris en charge (CPU, GPU, FPGA, VPU, etc.).
  3. Optimiseur de modèle : OpenVINO fournit un optimiseur de modèle qui importe, convertit et optimise les modèles provenant de frameworks de deep learning populaires tels que PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle et Caffe.
  4. Facilité d'utilisation : La boîte à outils est livrée avec une large collection de notebooks de tutoriels (incluant l'optimisation YOLO26) enseignant différents aspects de la boîte à outils.

Link to this sectionStructure d'exportation OpenVINO#

Lorsque tu exportes un modèle au format OpenVINO, cela génère un répertoire contenant ce qui suit :

  1. Fichier XML : Décrit la topologie du réseau.
  2. Fichier BIN : Contient les données binaires des poids et des biais.
  3. Fichier de mappage : Contient le mappage des tenseurs de sortie du modèle original vers les noms de tenseurs OpenVINO.

Tu peux utiliser ces fichiers pour exécuter l'inférence avec le moteur d'inférence OpenVINO.

Link to this sectionUtilisation de l'exportation OpenVINO dans le déploiement#

Une fois ton modèle exporté avec succès au format OpenVINO, tu as deux options principales pour exécuter l'inférence :

  1. Utilise le paquet ultralytics, qui fournit une API de haut niveau et enveloppe le runtime OpenVINO.

  2. Utilise le paquet openvino natif pour un contrôle plus avancé ou personnalisé du comportement de l'inférence.

Link to this sectionInférence avec Ultralytics#

Le paquet ultralytics te permet d'exécuter facilement l'inférence en utilisant le modèle OpenVINO exporté via la méthode predict. Tu peux également spécifier le périphérique cible (par ex. intel:gpu, intel:npu, intel:cpu) en utilisant l'argument device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Cette approche est idéale pour le prototypage rapide ou le déploiement lorsque tu n'as pas besoin d'un contrôle total sur le pipeline d'inférence.

Link to this sectionInférence avec le runtime OpenVINO#

Le runtime OpenVINO fournit une API unifiée pour l'inférence sur tout le matériel Intel pris en charge. Il offre également des fonctionnalités avancées comme l'équilibrage de charge sur le matériel Intel et l'exécution asynchrone. Pour plus d'informations sur l'exécution de l'inférence, consulte les notebooks YOLO26.

N'oublie pas que tu auras besoin des fichiers XML et BIN ainsi que de tous les paramètres spécifiques à l'application comme la taille d'entrée, le facteur d'échelle pour la normalisation, etc., pour configurer et utiliser correctement le modèle avec le Runtime.

Dans ton application de déploiement, tu effectuerais généralement les étapes suivantes :

  1. Initialise OpenVINO en créant core = Core().
  2. Charge le modèle en utilisant la méthode core.read_model().
  3. Compile le modèle en utilisant la fonction core.compile_model().
  4. Prépare l'entrée (image, texte, audio, etc.).
  5. Exécute l'inférence en utilisant compiled_model(input_data).

Pour des étapes plus détaillées et des extraits de code, réfère-toi à la documentation OpenVINO ou au tutoriel API.

Link to this sectionBenchmarks YOLO26 sous OpenVINO#

L'équipe Ultralytics a benchmarké YOLO26 sur divers formats de modèle et précisions, évaluant la vitesse et la précision sur différents appareils Intel compatibles avec OpenVINO.

Note
  • Les résultats des benchmarks ci-dessous sont donnés à titre indicatif et peuvent varier en fonction de la configuration matérielle et logicielle exacte d'un système, ainsi que de la charge de travail actuelle du système au moment où les benchmarks sont exécutés.

  • Tous les benchmarks ont été exécutés avec le paquet Python openvino version 2026.2.0.dev20260501. Nous mettrons à jour les benchmarks avec la version stable une fois la version 2026.2.0 publiée.

  • Les modèles YOLO26 sur NPU ne sont pris en charge que sur les systèmes Intel® Core™ Ultra™ avec la série 2xxV et la série 3xx et supérieures.

Link to this sectionIntel® Core™ Ultra#

La série Intel® Core™ Ultra™ représente une nouvelle référence dans l'informatique haute performance, conçue pour répondre aux demandes évolutives des utilisateurs modernes, des joueurs et des créateurs aux professionnels exploitant l'IA. Cette nouvelle génération est plus qu'une série de CPU traditionnelle ; elle combine des cœurs CPU puissants, des capacités GPU haute performance intégrées et une unité de traitement neuronal (NPU) dédiée au sein d'une seule puce, offrant une solution unifiée pour des charges de travail informatiques diverses et intensives.

Au cœur de l'architecture Intel® Core Ultra™ se trouve une conception hybride qui permet des performances exceptionnelles sur les tâches de traitement traditionnelles, les charges de travail accélérées par GPU et les opérations pilotées par IA. L'inclusion du NPU améliore l'inférence IA sur l'appareil, permettant un apprentissage automatique et un traitement des données plus rapides et plus efficaces sur un large éventail d'applications.

La famille Core Ultra™ comprend divers modèles adaptés aux différents besoins de performance, avec des options allant des conceptions économes en énergie aux variantes haute puissance marquées par la désignation « H », idéales pour les ordinateurs portables et les facteurs de forme compacts qui exigent une puissance de calcul importante. Sur toute la gamme, les utilisateurs bénéficient de la synergie de l'intégration CPU, GPU et NPU, offrant une efficacité, une réactivité et des capacités multitâches remarquables.

Dans le cadre de l'innovation continue d'Intel, la série Core Ultra™ établit une nouvelle norme pour l'informatique prête pour l'avenir. Avec plusieurs modèles disponibles et d'autres à venir, cette série souligne l'engagement d'Intel à fournir des solutions de pointe pour la prochaine génération d'appareils intelligents améliorés par l'IA.

Les benchmarks ci-dessous sont exécutés sur Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V et Intel® Core™ Ultra™ 7 155H aux précisions FP32, FP16 et INT8.

Link to this sectionIntel® Core™ Ultra™ X7 358H#

Benchmarks
Intel Core Ultra GPU benchmarks
Résultats détaillés des benchmarks
ModèleFormatPrécisionStatutTaille (MB)metrics/mAP50-95(B)Temps d'inférence (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

Benchmarks
Intel Core Ultra GPU benchmarks
Résultats détaillés des benchmarks
ModèleFormatPrécisionStatutTaille (MB)metrics/mAP50-95(B)Temps d'inférence (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531,43
YOLO26nOpenVINOFP329.60,47623.57
YOLO26nOpenVINOFP165.10,47623,53
YOLO26nOpenVINOINT83.20.46253,65
YOLO26sPyTorch (CPU)FP3219.50.570360,4
YOLO26sOpenVINOFP3236.70.56165,02
YOLO26sOpenVINOFP1618.60.56165,01
YOLO26sOpenVINOINT810.00.5474,31
YOLO26mPyTorch (CPU)FP3242.20.6196173,31
YOLO26mOpenVINOFP3278.30.61919,48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946,03
YOLO26lPyTorch (CPU)FP3250.70,6173224,52
YOLO26lOpenVINOFP3295.30,372511,88
YOLO26lOpenVINOFP1648.10.620112,0
YOLO26lOpenVINOINT825.20.59998,47
YOLO26xPyTorch (CPU)FP32113.20.6512595,72
YOLO26xOpenVINOFP32213.20,656720,26
YOLO26xOpenVINOFP16107.10,645420,25
YOLO26xOpenVINOINT854.80.637414,77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

Benchmarks
Intel Core Ultra GPU benchmarks
Résultats détaillés des benchmarks
ModèleFormatPrécisionStatutTaille (MB)metrics/mAP50-95(B)Temps d'inférence (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538,77
YOLO26nOpenVINOFP329.60,47749,87
YOLO26nOpenVINOFP165.10,47749,84
YOLO26nOpenVINOINT83.20,47055,86
YOLO26sPyTorch (CPU)FP3219.50.570369,54
YOLO26sOpenVINOFP3236.70.561617,29
YOLO26sOpenVINOFP1618.60.561617,06
YOLO26sOpenVINOINT810.00,545210,33
YOLO26mPyTorch (CPU)FP3242.20.6196192,22
YOLO26mOpenVINOFP3278.30,618734,64
YOLO26mOpenVINOFP1639.50,618734,75
YOLO26mOpenVINOINT820.50,607315,99
YOLO26lPyTorch (CPU)FP3250.70.6215245,62
YOLO26lOpenVINOFP3295.30,620243,7
YOLO26lOpenVINOFP1648.10,620244,65
YOLO26lOpenVINOINT825.20,604820,31
YOLO26xPyTorch (CPU)FP32113.20.6512513,06
YOLO26xOpenVINOFP32213.20,654480,19
YOLO26xOpenVINOFP16107.10,654479,83
YOLO26xOpenVINOINT854.80,639335,16

Link to this sectionReproduis nos résultats#

Pour reproduire les benchmarks Ultralytics ci-dessus sur tous les formats d'exportation, exécute ce code :

Exemple
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Note que les résultats des benchmarks peuvent varier en fonction de la configuration exacte du matériel et du logiciel d'un système, ainsi que de la charge de travail actuelle du système au moment où les benchmarks sont exécutés. Pour des résultats plus fiables, utilise un jeu de données avec un grand nombre d'images, par exemple data='coco.yaml' (5000 images de validation).

Link to this sectionConclusion#

Les résultats des benchmarks démontrent clairement les avantages de l'exportation du modèle YOLO26 vers le format OpenVINO. À travers différents modèles et plateformes matérielles, le format OpenVINO surpasse systématiquement les autres formats en termes de vitesse d'inférence tout en maintenant une précision comparable.

Les benchmarks soulignent l'efficacité d'OpenVINO en tant qu'outil pour déployer des modèles de deep learning. En convertissant les modèles au format OpenVINO, tu peux obtenir des améliorations de performance significatives, facilitant ainsi le déploiement de ces modèles dans des applications réelles.

Pour des informations plus détaillées et des instructions sur l'utilisation d'OpenVINO, consulte la documentation officielle d'OpenVINO.

Link to this sectionFAQ#

Link to this sectionComment exporter des modèles YOLO26 vers le format OpenVINO ?#

L'exportation des modèles YOLO26 vers le format OpenVINO peut considérablement améliorer la vitesse CPU et permettre des accélérations GPU et NPU sur le matériel Intel. Pour exporter, tu peux utiliser Python ou le CLI comme indiqué ci-dessous :

Exemple
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Pour plus d'informations, consulte la documentation sur les formats d'exportation.

Link to this sectionQuels sont les avantages d'utiliser OpenVINO avec les modèles YOLO26 ?#

L'utilisation du toolkit OpenVINO d'Intel avec les modèles YOLO26 offre plusieurs avantages :

  1. Performance : Obtenez jusqu'à 3x d'accélération sur l'inférence CPU et tirez parti des GPU et NPU Intel pour l'accélération.
  2. Optimiseur de modèle : Convertissez, optimisez et exécutez des modèles issus de frameworks populaires comme PyTorch, TensorFlow et ONNX.
  3. Facilité d'utilisation : Une vaste collection de notebooks tutoriels est disponible pour aider les utilisateurs à démarrer, y compris ceux pour YOLO26.
  4. Exécution hétérogène : Déployez des modèles sur divers matériels Intel avec une API unifiée.

Pour des comparaisons de performance détaillées, visite notre section benchmarks.

Link to this sectionComment puis-je exécuter l'inférence en utilisant un modèle YOLO26 exporté vers OpenVINO ?#

Après avoir exporté un modèle YOLO26n vers le format OpenVINO, tu peux exécuter l'inférence en utilisant Python ou le CLI :

Exemple
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Consulte notre documentation sur le mode prédiction pour plus de détails.

Link to this sectionPourquoi devrais-je choisir Ultralytics YOLO26 plutôt que d'autres modèles pour l'exportation OpenVINO ?#

Ultralytics YOLO26 est optimisé pour la détection d'objets en temps réel avec une grande précision et vitesse. Plus précisément, lorsqu'il est combiné avec OpenVINO, YOLO26 offre :

  • Jusqu'à 3x d'accélération sur les CPU Intel
  • Déploiement fluide sur les GPU et NPU Intel
  • Précision constante et comparable à travers divers formats d'exportation

Pour une analyse approfondie des performances, consulte nos benchmarks YOLO26 détaillés sur différents matériels.

Link to this sectionPuis-je benchmark les modèles YOLO26 sur différents formats tels que PyTorch, ONNX et OpenVINO ?#

Oui, tu peux benchmark les modèles YOLO26 dans divers formats incluant PyTorch, TorchScript, ONNX et OpenVINO. Utilise l'extrait de code suivant pour exécuter les benchmarks sur le jeu de données de ton choix :

Exemple
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Pour des résultats de benchmark détaillés, consulte notre section benchmarks et la documentation sur les formats d'exportation.

Commentaires