Link to this sectionExportation CoreML pour les modèles YOLO26#

Q: Comment exporter des modèles YOLO26 vers le format CoreML ?

Exécute model.export(format="coreml") en Python ou yolo export model=yolo26n.pt format=coreml via la CLI sur macOS ou Linux x86. Ajoute quantize=8 pour correspondre aux modèles officiels de l'application. L'exportation produit un ML Program yolo26n.mlpackage prêt pour Xcode, l'iOS SDK ou le plugin Flutter.

Q: Comment m'assurer que l'inférence s'exécute sur le Neural Engine ?

Définit MLModelConfiguration.computeUnits = .cpuAndNeuralEngine (le défaut du SDK iOS sur iOS 16+). Évite .all dans les applications caméra — le GPU est occupé par la composition de la prévisualisation, et planifier l'inférence dessus provoque une gigue de temps de trame. Confirme le placement avec un rapport de performance Xcode Core ML.

Q: Puis-je exécuter et valider des modèles CoreML avec la CLI Ultralytics ?

Oui, sur macOS : yolo predict model=yolo26n.mlpackage source=image.jpg et yolo val model=yolo26n.mlpackage data=coco8.yaml fonctionnent comme n'importe quel autre format. L'exécution CoreML nécessite du matériel Apple, donc ces modes ne sont pas disponibles sur Linux et Windows.

Apple intègre du silicium IA dédié — le Neural Engine — dans chaque iPhone, iPad et Mac moderne, et CoreML est la solution supportée par Ultralytics pour y déployer tes modèles dès aujourd'hui. Exporter tes modèles Ultralytics YOLO26 vers CoreML transforme un point de contrôle .pt entraîné en un .mlpackage natif qui exécute les sept tâches YOLO sur l'appareil avec une faible latence, sans connexion réseau et sans qu'aucune donnée ne quitte l'appareil.

Exécute YOLO sur l'Apple Neural Engine dès aujourd'hui avec les applications mobiles officielles

Le SDK iOS Ultralytics YOLO et le plugin Flutter officiels exécutent les exports CoreML sur l'Apple Neural Engine dès leur installation — inférence caméra en temps réel, prédiction sur image unique et téléchargement automatique de modèles pour les sept tâches YOLO26, y compris Depth. Pour un déploiement NPU sur Android, consulte l'intégration Qualcomm QNN.

Le futur format Core AI d'Apple

Apple a introduit le nouveau framework Core AI et le format .aimodel pour la génération iOS 27 et macOS 27. L'exportation Ultralytics Core AI est prévue pour le quatrième trimestre 2026 mais n'est pas encore disponible. CoreML reste le format pris en charge pour les versions actuelles d'Ultralytics et pour une compatibilité plus large avec les appareils Apple.

Watch: How to Export Ultralytics YOLO26 to CoreML for 2x Fast Inference on Apple Devices 🚀

Link to this sectionQu'est-ce que CoreML ?#

Apple CoreML deployment pipeline

CoreML (stylisé « Core ML » par Apple) est le framework d'apprentissage automatique sur appareil d'Apple. Il charge les modèles dans le format moderne ML Program — le bundle .mlpackage produit par l'exportateur Ultralytics — et les planifie sur le CPU, le GPU et l'Apple Neural Engine (ANE) de l'appareil, le NPU dédié présent dans chaque puce Apple Silicon. Comme tout s'exécute localement, l'inférence fonctionne hors ligne, n'ajoute aucune latence réseau et conserve les données utilisateur sur l'appareil.

CoreML s'intègre directement au framework Vision d'Apple, qui gère la mise à l'échelle et l'orientation des images avant qu'elles n'atteignent le modèle — c'est ainsi que le SDK iOS Ultralytics transmet les flux de caméra à YOLO avec un coût de prétraitement pratiquement nul.

Link to this sectionPourquoi exporter YOLO26 vers CoreML ?#

Vitesse du Neural Engine : la détection YOLO26n s'exécute de bout en bout en 3,8 ms sur un iPhone 17 Pro pour des images uniques et 11,3 ms/image en utilisation caméra en temps réel soutenue ; YOLO26n Depth prend 5,5 ms pour une image unique et 16,5 ms/image en caméra live (voir le tableau et les notes ci-dessous).
Conçu sans NMS : YOLO26 est end-to-end, donc le graphe exporté ne nécessite aucun pipeline NMS et le décodage est inférieur à la milliseconde. Les modèles de détection plus anciens comme YOLO11 peuvent intégrer un pipeline NMS CoreML avec nms=True.
Privé et hors ligne : Tous les calculs restent sur l'appareil — pas d'aller-retour avec le cloud, pas de clés API, une confidentialité des données totale.
Une seule exportation, tout l'écosystème : Le même .mlpackage fonctionne sur iOS, iPadOS, macOS, watchOS, tvOS et visionOS, et alimente le SDK iOS et le plugin Flutter officiels d'Ultralytics.

Link to this sectionPerformances mesurées#

Inférence de bout en bout sur image unique pour les modèles CoreML YOLO26n INT8 officiels sur un iPhone 17 Pro (Apple A19, iOS 26.5.2). Chaque cellule indique le temps total (prétraitement + inférence + post-traitement, annotation exclue) avec le détail par étape en dessous. Sur iOS, Vision effectue la mise à l'échelle de l'entrée au sein de la requête d'inférence ; par conséquent, le prétraitement est indiqué comme étant 0 et son coût est inclus dans l'inférence.

Modèle	Tâche	taille ^(pixels)	CPU ^{.cpuOnly (ms)}	Neural Engine ^{.cpuAndNeuralEngine (ms)}
YOLO26n	Détection	640	9.1 ^{0.0 / 9.1 / 0.0}	3.8 ^{0.0 / 3.8 / 0.0}
YOLO26n-seg	Segmentation	640	12.3 ^{0.0 / 12.1 / 0.2}	4.8 ^{0.0 / 4.5 / 0.3}
YOLO26n-sem	Sémantique	1024¹	21.8 ^{0.0 / 21.0 / 0.8}	12.1 ^{0.0 / 11.3 / 0.8}
YOLO26n-depth	Depth	640	24.8 ^{0.0 / 23.9 / 0.9}	5.5 ^{0.0 / 4.7 / 0.9}
YOLO26n-cls	Classification	224	2.2 ^{0.0 / 2.2 / 0.0}	2.0 ^{0.0 / 2.0 / 0.0}
YOLO26n-pose	Pose	640	12.0 ^{0.0 / 11.9 / 0.0}	3.8 ^{0.0 / 3.8 / 0.0}
YOLO26n-obb	OBB	1024	21.7 ^{0.0 / 21.7 / 0.0}	7,2 ^{0,0 / 7,2 / 0,0}

¹ Les exports CoreML sémantiques intègrent l'ArgMax dans le graphe et renvoient une carte de classes compacte en pleine résolution ([1, 1024, 1024]) au lieu de logits flottants, ce qui rend le post-traitement quasi instantané (moins d'une milliseconde) et permet un rendu net des masques au pixel près.
Les valeurs de vitesse sont des latences de rafale sur image unique — la moyenne de 15 exécutions après 3 exécutions de préchauffage sur bus.jpg, mesurées via le minutage par étape du SDK iOS grâce au harnais de benchmark du plugin Flutter en mode profile (code natif optimisé). Le fonctionnement soutenu de la caméra en temps réel est plus élevé car il inclut le pipeline de capture et de mise à l'échelle ainsi que la stabilisation thermique : la détection YOLO26n mesure 11,3 ms/image et YOLO26n Depth 16,5 ms/image dans l'application caméra live sur le même appareil — consulte la documentation de performance du SDK iOS pour le profilage en régime permanent.
Le tableau correspondant CPU/GPU/NPU Snapdragon se trouve dans l'intégration Qualcomm QNN.

Link to this sectionExporter des modèles YOLO26 vers CoreML#

Link to this sectionInstallation#

Pour installer le package requis, exécute :

Installation

# Install the required package for YOLO26
pip install ultralytics

Le convertisseur coremltools est installé automatiquement lors de la première exportation. L'exportation s'exécute sur macOS ou Linux x86 ; pour des instructions détaillées et les meilleures pratiques, consulte notre guide d'installation et le guide des problèmes courants.

Link to this sectionUtilisation#

Le format CoreML prend en charge les modes Export, Predict et Validate. L'inférence et la validation avec CoreML ne s'exécutent que sur macOS. Exporte ton modèle, puis charge-le pour effectuer des inférences ou valider sa précision.

Exporter (Export)

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to CoreML with INT8 weight quantization, matching the official app models
model.export(format="coreml", quantize=8)  # creates 'yolo26n.mlpackage'

Prédire (Predict)

from ultralytics import YOLO

# Load the exported CoreML model (macOS)
model = YOLO("yolo26n.mlpackage")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Valider

from ultralytics import YOLO

# Load the exported CoreML model (macOS)
model = YOLO("yolo26n.mlpackage")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionArguments d'exportation#

Argument	Type	Défaut	Description
`format`	`str`	`'coreml'`	Format cible pour le modèle exporté, définissant la compatibilité avec divers environnements de déploiement.
`imgsz`	`int` ou `tuple`	`640`	Taille d'image souhaitée pour l'entrée du modèle. Peut être un entier pour des images carrées ou un tuple `(height, width)` pour des dimensions spécifiques.
`quantize`	`int` ou `str`	`None`	Précision de quantification (poids uniquement pour CoreML) : `16` (FP16), `8` (INT8), `"w8a16"` (poids INT8 avec activations FP16), ou `32`/non défini (FP32). Les programmes ML sans NMS utilisent FP16 pour l'aperçu Xcode ; transmets `32` pour outrepasser. Remplace les anciens indicateurs `half`/`int8` obsolètes.
`nms`	`bool`	`False`	Intègre un pipeline NMS CoreML. Modèles de détection uniquement (ignoré avec un avertissement pour les autres tâches) ; non nécessaire pour YOLO26 qui est sans NMS, à utiliser pour des modèles antérieurs comme YOLO11.
`dynamic`	`bool`	`False`	Autorise des tailles d'entrée dynamiques, améliorant la flexibilité dans la gestion de dimensions d'image variables.
`batch`	`int`	`1`	Spécifie la taille de l'inférence par lot du modèle exporté ou le nombre maximal d'images que le modèle exporté traitera simultanément en mode `predict`.
`device`	`str`	`None`	Spécifie l'appareil pour l'exportation : GPU (`device=0`), CPU (`device=cpu`), MPS pour Apple silicon (`device=mps`).

Pour plus de détails sur le processus d'exportation, visite la page de documentation Ultralytics sur l'exportation.

Link to this sectionCibler le Neural Engine#

CoreML choisit le matériel via MLModelConfiguration.computeUnits. Le SDK iOS Ultralytics utilise par défaut .cpuAndNeuralEngine sur iOS 16+ plutôt que .all : dans une application caméra en temps réel, le GPU est déjà occupé par la composition de la prévisualisation et des superpositions, donc l'exclure évite les conflits et la gigue de temps de trame pendant que l'ANE fait le gros du travail. Utilise .cpuOnly uniquement pour les tests de compatibilité — le tableau ci-dessus montre le coût associé.

L'exécution d'un modèle CoreML depuis Python sur un hôte Mac (via Ultralytics ou coremltools) suit la même règle : Ultralytics se charge avec ComputeUnit.CPU_AND_NE (macOS 13+, avec repli sur CPU_ONLY pour les anciennes versions de macOS), ce qui maintient l'inférence sur le Neural Engine (~3× plus rapide que le CPU). Cela permet également d'éviter une limitation actuelle des hôtes macOS où ComputeUnit.ALL / CPU_AND_GPU par défaut — qui ajoutent le chemin de compilation GPU/MPSGraph — interrompent le processus avec une assertion Error: MLIR pass manager failed sur coremltools 9.x.

Link to this sectionDéployer des modèles CoreML YOLO26 exportés#

Le chemin le plus rapide est le SDK Ultralytics YOLO iOS officiel, le même package Swift qui alimente l'application Ultralytics iOS et le plugin Flutter. Il résout automatiquement les noms de modèles officiels, télécharge et met en cache le .mlpackage, et renvoie des résultats entièrement décodés :

import UltralyticsYOLO

// Loads the official INT8 model (downloaded and cached on first use), then runs inference
let yolo = YOLO("yolo26n", task: .detect) { result in
    if case .success(let model) = result {
        let results = model(uiImage)  // boxes, labels, confidences, timing
    }
}

Pour les applications caméra, utilise le YOLOView du SDK pour une inférence en temps réel avec des superpositions natives, ou utilise le plugin Flutter pour des applications multiplateformes qui partagent une base de code avec Android.

L'intégration manuelle d'un .mlpackage brut est également simple avec la stack Apple — charge-le avec MLModel, encapsule-le dans une VNCoreMLRequest et transmets les images via VNImageRequestHandler. Ces ressources couvrent les détails :

Intégrer un modèle Core ML dans ton application : Le guide d'Apple pour intégrer et appeler un modèle CoreML.
CoreML Tools : Référence sur la conversion, la quantification et l'optimisation pour la chaîne d'outils coremltools qui alimente cette exportation.
Rapports de performance Xcode Core ML : Placement des couches sur le périphérique et profilage de la latence pour ton modèle et ton appareil exacts.

Distribue le modèle soit intégré au bundle de l'application (disponibilité instantanée, idéal pour les modèles nano/small), soit téléchargé lors de la première exécution et mis en cache (binaire plus léger, mises à jour de modèle faciles) — les applications officielles utilisent la seconde approche avec les actifs de version GitHub.

Link to this sectionFlux de travail recommandé#

Entraîne ton modèle avec le mode Train d'Ultralytics, ou commence avec les poids officiels YOLO26
Exporte avec model.export(format="coreml", quantize=8) sur macOS ou Linux x86.
Vérifie la précision avec model.val() sur un Mac, et profile avec un rapport de performance Xcode Core ML sur ton appareil cible
Déploie avec le SDK iOS, le plugin Flutter ou ta propre intégration Vision, en ciblant .cpuAndNeuralEngine

Link to this sectionRésumé#

Dans ce guide, tu as appris à exporter des modèles Ultralytics YOLO26 vers le format .mlpackage de CoreML, à les quantifier pour l'Apple Neural Engine et à les déployer avec des latences de l'ordre de la milliseconde — que ce soit via le SDK iOS officiel et le plugin Flutter ou ta propre intégration Vision. Pour d'autres cibles de déploiement, consulte la page du guide d'intégration, et compare les formats avec le mode Benchmark.

Link to this sectionFAQ#

Link to this sectionComment exporter des modèles YOLO26 vers le format CoreML ?#

Exécute model.export(format="coreml") en Python ou yolo export model=yolo26n.pt format=coreml via la CLI sur macOS ou Linux x86. Ajoute quantize=8 pour correspondre aux modèles officiels de l'application. L'exportation produit un ML Program yolo26n.mlpackage prêt pour Xcode, l'iOS SDK ou le plugin Flutter.

Link to this sectionDois-je utiliser `nms=True` lors de l'exportation de YOLO26 ?#

Non. YOLO26 est conçu sans NMS de bout en bout, donc le graphe exporté émet déjà les détections finales et les coûts de décodage sont bien inférieurs à une milliseconde. L'option nms=True existe pour les modèles de détection antérieurs tels que YOLO11, où elle intègre un pipeline NMS CoreML afin que ton application n'ait pas à implémenter la suppression. Les pipelines NMS CoreML ne prennent en charge que la détection d'objets, donc nms=True est ignoré avec un avertissement pour d'autres tâches comme la segmentation et la pose.

Link to this sectionQuelle précision dois-je utiliser — FP16 ou INT8 ?#

Les modèles officiels de l'application Ultralytics sont fournis en INT8, ce qui minimise la taille du téléchargement et permet d'atteindre les vitesses indiquées dans le tableau ci-dessus. quantize=16 (FP16) est une alternative prudente sans perte de précision notable. Valide ton export spécifique avec model.val() sur un Mac avant la mise en production.

Link to this sectionComment m'assurer que l'inférence s'exécute sur le Neural Engine ?#

Définit MLModelConfiguration.computeUnits = .cpuAndNeuralEngine (le défaut du SDK iOS sur iOS 16+). Évite .all dans les applications caméra — le GPU est occupé par la composition de la prévisualisation, et planifier l'inférence dessus provoque une gigue de temps de trame. Confirme le placement avec un rapport de performance Xcode Core ML.

Link to this sectionPuis-je exécuter et valider des modèles CoreML avec la CLI Ultralytics ?#

Oui, sur macOS : yolo predict model=yolo26n.mlpackage source=image.jpg et yolo val model=yolo26n.mlpackage data=coco8.yaml fonctionnent comme n'importe quel autre format. L'exécution CoreML nécessite du matériel Apple, donc ces modes ne sont pas disponibles sur Linux et Windows.

Link to this sectionQuel est le moyen le plus rapide de faire fonctionner YOLO26 dans une application iOS ou Flutter ?#

Utilise le SDK Ultralytics YOLO iOS officiel (Swift Package) ou le plugin Flutter. Les deux chargent les modèles officiels par nom avec téléchargement et mise en cache automatiques, les exécutent sur le Neural Engine et incluent des interfaces utilisateur caméra temps réel complètes — le tableau de performance mesuré ci-dessus a été produit avec exactement cette stack.

Contributeurs

GLglenn-jocher²² RIRizwanMunawar⁴ LAlakshanthad³ Y-Y-T-G² ONonuralpszr¹ RAraimbekovm¹ WIWillieMaddox¹ MAMatthewNoyce¹ ABabirami-vina¹

Créé 7 févr. 2024Mis à jour il y a 3 jours