Link to this sectionAnalyse comparative des options de déploiement de YOLO26#
Link to this sectionIntroduction#
Tu as parcouru un long chemin avec YOLO26. Tu as collecté tes données avec diligence, tu les as annotées minutieusement et tu as consacré le temps nécessaire pour entraîner et évaluer rigoureusement ton modèle YOLO26 personnalisé. Il est maintenant temps de mettre ton modèle au service de ton application, cas d'usage ou projet spécifique. Mais une décision cruciale se pose à toi : comment exporter et déployer ton modèle efficacement.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Ce guide t'accompagne à travers les options de déploiement de YOLO26 et les facteurs essentiels à prendre en compte pour choisir la bonne option pour ton projet.
Link to this sectionComment choisir la bonne option de déploiement pour ton modèle YOLO26#
Au moment de déployer ton modèle YOLO26, sélectionner un format d'exportation adapté est très important. Comme indiqué dans la documentation des modes d'Ultralytics YOLO26, la fonction model.export() te permet de convertir ton modèle entraîné vers divers formats conçus pour des environnements et des exigences de performance variés.
Le format idéal dépend du contexte opérationnel prévu pour ton modèle, en équilibrant la vitesse, les contraintes matérielles et la facilité d'intégration. Pour un déploiement géré sans exportation manuelle, Ultralytics Platform propose des points de terminaison d'inférence prêts à l'emploi avec mise à l'échelle automatique dans 43 régions mondiales. Dans la section suivante, nous examinerons plus en détail chaque option d'exportation pour comprendre quand choisir chacune d'entre elles.
Link to this sectionOptions de déploiement de YOLO26#
Explorons les différentes options de déploiement de YOLO26. Pour une présentation détaillée du processus d'exportation, visite la page de documentation d'Ultralytics sur l'exportation.
Link to this sectionPyTorch#
PyTorch est une bibliothèque de machine learning open-source largement utilisée pour les applications en deep learning et en intelligence artificielle. Elle offre un haut niveau de flexibilité et de rapidité, ce qui en fait l'une des favorites des chercheurs et des développeurs.
- Repères de performance : PyTorch est reconnu pour sa facilité d'utilisation et sa flexibilité, ce qui peut entraîner un léger compromis en matière de performance brute par rapport à d'autres frameworks plus spécialisés et optimisés.
- Compatibilité et intégration : Offre une excellente compatibilité avec diverses bibliothèques de science des données et de machine learning en Python.
- Support communautaire et écosystème : L'une des communautés les plus dynamiques, avec des ressources étendues pour l'apprentissage et le dépannage.
- Études de cas : Couramment utilisé dans les prototypes de recherche, de nombreux articles universitaires font référence à des modèles déployés sous PyTorch.
- Maintenance et mises à jour : Mises à jour régulières avec un développement actif et la prise en charge de nouvelles fonctionnalités.
- Considérations de sécurité : Correctifs réguliers pour les problèmes de sécurité, mais la sécurité dépend en grande partie de l'environnement global dans lequel il est déployé.
- Accélération matérielle : Prend en charge CUDA pour l'accélération GPU, indispensable pour accélérer l'entraînement et l'inférence des modèles.
Link to this sectionTorchScript#
TorchScript étend les capacités de PyTorch en permettant l'exportation de modèles pour être exécutés dans un environnement runtime C++. Cela le rend adapté aux environnements de production où Python n'est pas disponible.
- Repères de performance : Peut offrir des performances améliorées par rapport au PyTorch natif, surtout dans les environnements de production.
- Compatibilité et intégration : Conçu pour une transition fluide de PyTorch vers des environnements de production C++, bien que certaines fonctionnalités avancées puissent ne pas se traduire parfaitement.
- Support communautaire et écosystème : Bénéficie de la large communauté de PyTorch mais possède un cercle plus restreint de développeurs spécialisés.
- Études de cas : Largement utilisé dans les environnements industriels où la surcharge de performance de Python constitue un goulot d'étranglement.
- Maintenance et mises à jour : Maintenu parallèlement à PyTorch avec des mises à jour cohérentes.
- Considérations de sécurité : Offre une sécurité améliorée en permettant l'exécution de modèles dans des environnements sans installation complète de Python.
- Accélération matérielle : Hérite du support CUDA de PyTorch, garantissant une utilisation efficace du GPU.
Link to this sectionONNX#
L'Open Neural Network Exchange (ONNX) est un format qui permet l'interopérabilité des modèles entre différents frameworks, ce qui peut être essentiel lors du déploiement sur diverses plateformes.
- Repères de performance : Les modèles ONNX peuvent connaître des performances variables selon l'environnement d'exécution spécifique sur lequel ils sont déployés.
- Compatibilité et intégration : Haute interopérabilité entre de multiples plateformes et matériels grâce à sa nature agnostique au framework.
- Support communautaire et écosystème : Soutenu par de nombreuses organisations, menant à un vaste écosystème et à une variété d'outils d'optimisation.
- Études de cas : Fréquemment utilisé pour déplacer des modèles entre différents frameworks de machine learning, démontrant sa flexibilité.
- Maintenance et mises à jour : En tant que standard ouvert, ONNX est régulièrement mis à jour pour prendre en charge de nouvelles opérations et modèles.
- Considérations de sécurité : Comme avec tout outil multiplateforme, il est essentiel de garantir des pratiques sécurisées dans le pipeline de conversion et de déploiement.
- Accélération matérielle : Avec ONNX Runtime, les modèles peuvent tirer parti de diverses optimisations matérielles.
Link to this sectionOpenVINO#
OpenVINO est une boîte à outils Intel conçue pour faciliter le déploiement de modèles de deep learning sur le matériel Intel, améliorant ainsi les performances et la vitesse.
- Repères de performance : Spécifiquement optimisé pour les processeurs Intel (CPU), GPU et VPU, offrant des gains de performance significatifs sur le matériel compatible.
- Compatibilité et intégration : Fonctionne mieux au sein de l'écosystème Intel mais prend également en charge une gamme d'autres plateformes.
- Support communautaire et écosystème : Soutenu par Intel, avec une base d'utilisateurs solide, particulièrement dans le domaine de la computer vision.
- Études de cas : Souvent utilisé dans des scénarios d'IoT et d'edge computing où le matériel Intel est prédominant.
- Maintenance et mises à jour : Intel met régulièrement à jour OpenVINO pour prendre en charge les derniers modèles de deep learning et le matériel Intel.
- Considérations de sécurité : Fournit des fonctionnalités de sécurité robustes adaptées au déploiement dans des applications sensibles.
- Accélération matérielle : Conçu pour l'accélération sur le matériel Intel, en tirant parti de jeux d'instructions et de fonctionnalités matérielles dédiés.
Pour plus de détails sur le déploiement avec OpenVINO, consulte la documentation d'intégration d'Ultralytics : Intel OpenVINO Export.
Link to this sectionTensorRT#
TensorRT est un optimiseur et runtime d'inférence de deep learning haute performance d'NVIDIA, idéal pour les applications nécessitant vitesse et efficacité.
- Repères de performance : Offre des performances de premier ordre sur les GPU NVIDIA avec prise en charge d'une inférence haute vitesse.
- Compatibilité et intégration : Mieux adapté au matériel NVIDIA, avec un support limité en dehors de cet environnement.
- Support communautaire et écosystème : Réseau de support solide via les forums de développeurs et la documentation d'NVIDIA.
- Études de cas : Largement adopté dans les secteurs nécessitant une inférence en temps réel sur des données vidéo et d'image.
- Maintenance et mises à jour : NVIDIA maintient TensorRT avec des mises à jour fréquentes pour améliorer les performances et prendre en charge les nouvelles architectures GPU.
- Considérations de sécurité : Comme beaucoup de produits NVIDIA, il met l'accent sur la sécurité, mais les détails dépendent de l'environnement de déploiement.
- Accélération matérielle : Conçu exclusivement pour les GPU NVIDIA, offrant une optimisation et une accélération poussées.
Pour plus d'informations sur le déploiement avec TensorRT, consulte le guide d'intégration TensorRT.
Link to this sectionCoreML#
CoreML est le framework de machine learning d'Apple, optimisé pour les performances sur appareil dans l'écosystème Apple, incluant iOS, macOS, watchOS et tvOS.
- Repères de performance : Optimisé pour les performances sur appareil sur le matériel Apple avec une consommation de batterie minimale.
- Compatibilité et intégration : Exclusivement pour l'écosystème d'Apple, offrant un flux de travail rationalisé pour les applications iOS et macOS.
- Support communautaire et écosystème : Soutien solide d'Apple et communauté de développeurs dédiée, avec une documentation et des outils étendus.
- Études de cas : Couramment utilisé dans les applications nécessitant des capacités de machine learning sur appareil sur les produits Apple.
- Maintenance et mises à jour : Régulièrement mis à jour par Apple pour prendre en charge les dernières avancées en machine learning et le matériel Apple.
- Considérations de sécurité : Bénéficie de l'accent mis par Apple sur la confidentialité des utilisateurs et la data security.
- Accélération matérielle : Tire pleinement parti du moteur neuronal et du GPU d'Apple pour les tâches de machine learning accélérées.
Link to this sectionTF SavedModel#
TF SavedModel est le format de TensorFlow pour enregistrer et servir des modèles de machine learning, particulièrement adapté aux environnements de serveur évolutifs.
- Repères de performance : Offre des performances évolutives dans les environnements de serveur, surtout lorsqu'il est utilisé avec TensorFlow Serving.
- Compatibilité et intégration : Large compatibilité dans l'écosystème TensorFlow, incluant les déploiements cloud et serveur d'entreprise.
- Support communautaire et écosystème : Grand soutien communautaire dû à la popularité de TensorFlow, avec une vaste gamme d'outils pour le déploiement et l'optimisation.
- Études de cas : Utilisé de manière intensive dans les environnements de production pour servir des modèles de deep learning à grande échelle.
- Maintenance et mises à jour : Soutenu par Google et la communauté TensorFlow, garantissant des mises à jour régulières et de nouvelles fonctionnalités.
- Considérations de sécurité : Le déploiement utilisant TensorFlow Serving inclut des fonctionnalités de sécurité robustes pour les applications de niveau entreprise.
- Accélération matérielle : Prend en charge diverses accélérations matérielles via les backends de TensorFlow.
Link to this sectionTF GraphDef#
TF GraphDef est un format TensorFlow qui représente le modèle sous forme de graphe, ce qui est bénéfique pour les environnements où un graphe de calcul statique est requis.
- Repères de performance : Fournit des performances stables pour les graphes de calcul statiques, avec un accent sur la cohérence et la fiabilité.
- Compatibilité et intégration : S'intègre facilement dans l'infrastructure de TensorFlow mais moins flexible que SavedModel.
- Support communautaire et écosystème : Bon soutien de l'écosystème TensorFlow, avec de nombreuses ressources disponibles pour optimiser les graphes statiques.
- Études de cas : Utile dans les scénarios où un graphe statique est nécessaire, comme dans certains systèmes embarqués.
- Maintenance et mises à jour : Mises à jour régulières parallèlement aux mises à jour principales de TensorFlow.
- Considérations de sécurité : Garantit un déploiement sûr avec les pratiques de sécurité établies de TensorFlow.
- Accélération matérielle : Peut utiliser les options d'accélération matérielle de TensorFlow, bien que moins flexible que SavedModel.
Apprends-en plus sur TF GraphDef dans notre guide d'intégration TF GraphDef.
Link to this sectionTF Lite#
TF Lite est la solution de TensorFlow pour le machine learning sur mobile et appareils embarqués, fournissant une bibliothèque légère pour l'inférence sur appareil.
- Repères de performance : Conçu pour la vitesse et l'efficacité sur les appareils mobiles et embarqués.
- Compatibilité et intégration : Peut être utilisé sur une large gamme d'appareils grâce à sa nature légère.
- Support communautaire et écosystème : Soutenu par Google, il possède une communauté robuste et un nombre croissant de ressources pour les développeurs.
- Études de cas : Populaire dans les applications mobiles qui nécessitent une inférence sur appareil avec une empreinte minimale.
- Maintenance et mises à jour : Régulièrement mis à jour pour inclure les dernières fonctionnalités et optimisations pour les appareils mobiles.
- Considérations de sécurité : Fournit un environnement sécurisé pour exécuter des modèles sur les appareils des utilisateurs finaux.
- Accélération matérielle : Prend en charge diverses options d'accélération matérielle, incluant le GPU et le DSP.
Link to this sectionTF Edge TPU#
TF Edge TPU est conçu pour un calcul rapide et efficace sur le matériel Edge TPU de Google, parfait pour les appareils IoT nécessitant un traitement en temps réel.
- Repères de performance : Spécifiquement optimisé pour un calcul rapide et efficace sur le matériel Edge TPU de Google.
- Compatibilité et intégration : Fonctionne exclusivement avec les modèles TensorFlow Lite sur les appareils Edge TPU.
- Support communautaire et écosystème : Soutien croissant avec des ressources fournies par Google et des développeurs tiers.
- Études de cas : Utilisé dans les appareils IoT et les applications qui nécessitent un traitement en temps réel avec une faible latence.
- Maintenance et mises à jour : Continuellement amélioré pour tirer parti des capacités des nouvelles versions du matériel Edge TPU.
- Considérations de sécurité : S'intègre à la sécurité robuste de Google pour l'IoT et les appareils edge.
- Accélération matérielle : Conçu sur mesure pour tirer pleinement parti des appareils Google Coral.
Link to this sectionHailo HEF#
Hailo HEF est un format exécutable compilé pour les accélérateurs IA Hailo, incluant les appareils Hailo-8, Hailo-8L et Hailo-15. Les modèles de détection Ultralytics YOLO sont d'abord exportés en ONNX, puis compilés en HEF avec le Hailo Dataflow Compiler externe. HEF n'est pas une cible d'exportation Ultralytics directe ; pour les flux de travail d'accélération edge pris en charge, compare d'abord Axelera AI et DeepX.
- Repères de performance : Dépend du matériel Hailo, de la version du SDK Hailo, du script de modèle, de la configuration NMS et des données de calibration.
- Compatibilité et intégration : Uniquement pour les systèmes embarqués alimentés par Hailo, les passerelles industrielles et les déploiements de Raspberry Pi AI Kit.
- Support communautaire et écosystème : pris en charge via le Hailo Developer Zone, HailoRT, TAPPAS et le Hailo Model Zoo.
- Études de cas : utile pour la détection d'objets en temps réel sur les caméras, la robotique, le contrôle d'accès, la ville intelligente et les dispositifs d'inspection industrielle.
- Maintenance et mises à jour : dépend des mises à jour du Hailo SDK, du firmware et du model-zoo pour les nouvelles cibles d'accélération.
- Considérations de sécurité : prend en charge l'inférence locale sur l'appareil où les données restent à la périphérie.
- Accélération matérielle : utilise l'exécution Hailo NPU via des artefacts HEF compilés.
Pour un workflow étape par étape, consulte le guide d'intégration Hailo.
Link to this sectionTF.js#
TensorFlow.js (TF.js) est une bibliothèque qui apporte des capacités d'apprentissage automatique directement dans le navigateur, offrant un nouveau champ de possibilités aux développeurs web et aux utilisateurs. Elle permet l'intégration de modèles d'apprentissage automatique dans des applications web sans avoir besoin d'infrastructure back-end.
- Benchmarks de performance : permet l'apprentissage automatique directement dans le navigateur avec des performances raisonnables, selon l'appareil client.
- Compatibilité et intégration : haute compatibilité avec les technologies web, permettant une intégration facile dans les applications web.
- Support communautaire et écosystème : support d'une communauté de développeurs web et Node.js, avec une variété d'outils pour déployer des modèles ML dans les navigateurs.
- Études de cas : idéal pour les applications web interactives qui bénéficient de l'apprentissage automatique côté client sans nécessiter de traitement côté serveur.
- Maintenance et mises à jour : maintenu par l'équipe TensorFlow avec les contributions de la communauté open-source.
- Considérations de sécurité : s'exécute dans le contexte sécurisé du navigateur, en utilisant le modèle de sécurité de la plateforme web.
- Accélération matérielle : les performances peuvent être améliorées avec des API web qui accèdent à l'accélération matérielle comme WebGL.
Link to this sectionPaddlePaddle#
PaddlePaddle est un framework d'apprentissage profond open-source développé par Baidu. Il est conçu pour être à la fois efficace pour les chercheurs et facile à utiliser pour les développeurs. Il est particulièrement populaire en Chine et offre un support spécialisé pour le traitement de la langue chinoise.
- Benchmarks de performance : offre des performances compétitives en mettant l'accent sur la facilité d'utilisation et l'évolutivité.
- Compatibilité et intégration : bien intégré dans l'écosystème de Baidu et prend en charge une large gamme d'applications.
- Support communautaire et écosystème : bien que la communauté soit plus petite à l'échelle mondiale, elle croît rapidement, surtout en Chine.
- Études de cas : couramment utilisé sur les marchés chinois et par les développeurs cherchant des alternatives aux autres frameworks majeurs.
- Maintenance et mises à jour : mis à jour régulièrement avec un accent mis sur les applications et services d'IA en langue chinoise.
- Considérations de sécurité : met l'accent sur la confidentialité des données et la sécurité, répondant aux normes de gouvernance des données chinoises.
- Accélération matérielle : prend en charge diverses accélérations matérielles, y compris les puces Kunlun de Baidu.
Link to this sectionMNN#
MNN est un framework d'apprentissage profond très efficace et léger. Il prend en charge l'inférence et l'entraînement de modèles d'apprentissage profond et possède des performances à la pointe de l'industrie pour l'inférence et l'entraînement sur appareil. De plus, MNN est également utilisé sur des appareils embarqués, tels que l'IoT.
- Benchmarks de performance : haute performance pour les appareils mobiles avec une excellente optimisation pour les systèmes ARM.
- Compatibilité et intégration : fonctionne bien avec les systèmes mobiles et embarqués ARM et les architectures CPU X86-64.
- Support communautaire et écosystème : pris en charge par la communauté d'apprentissage automatique mobile et embarqué.
- Études de cas : idéal pour les applications nécessitant une performance efficace sur les systèmes mobiles.
- Maintenance et mises à jour : régulièrement maintenu pour garantir des performances élevées sur les appareils mobiles.
- Considérations de sécurité : fournit des avantages de sécurité sur l'appareil en gardant les données locales.
- Accélération matérielle : optimisé pour les CPU et GPU ARM pour une efficacité maximale.
Link to this sectionNCNN#
NCNN est un framework d'inférence de réseau de neurones haute performance optimisé pour la plateforme mobile. Il se distingue par sa nature légère et son efficacité, ce qui le rend particulièrement bien adapté aux appareils mobiles et embarqués où les ressources sont limitées.
- Benchmarks de performance : hautement optimisé pour les plateformes mobiles, offrant une inférence efficace sur les appareils basés sur ARM.
- Compatibilité et intégration : adapté aux applications sur téléphones mobiles et systèmes embarqués avec architecture ARM.
- Support communautaire et écosystème : pris en charge par une communauté de niche mais active, axée sur les applications ML mobiles et embarquées.
- Études de cas : privilégié pour les applications mobiles où l'efficacité et la vitesse sont critiques sur Android et d'autres systèmes basés sur ARM.
- Maintenance et mises à jour : continuellement amélioré pour maintenir des performances élevées sur une gamme d'appareils ARM.
- Considérations de sécurité : se concentre sur l'exécution locale sur l'appareil, tirant parti de la sécurité inhérente au traitement sur appareil.
- Accélération matérielle : conçu pour les CPU et GPU ARM, avec des optimisations spécifiques pour ces architectures.
Link to this sectionAnalyse comparative des options de déploiement de YOLO26#
Le tableau suivant donne un aperçu des diverses options de déploiement disponibles pour les modèles YOLO26, t'aidant à évaluer ce qui pourrait le mieux répondre aux besoins de ton projet en fonction de plusieurs critères critiques. Pour un examen approfondi du format de chaque option de déploiement, consulte la page de documentation Ultralytics sur les formats d'exportation.
| Option de déploiement | Benchmarks de performance | Compatibilité et intégration | Support communautaire et écosystème | Études de cas | Maintenance et mises à jour | Considérations de sécurité | Accélération matérielle |
|---|---|---|---|---|---|---|---|
| PyTorch | Bonne flexibilité ; peut compromettre les performances brutes | Excellent avec les bibliothèques Python | Ressources et communauté étendues | Recherche et prototypes | Développement régulier et actif | Dépend de l'environnement de déploiement | Support CUDA pour l'accélération GPU |
| TorchScript | Meilleur pour la production que PyTorch | Transition fluide de PyTorch vers C++ | Spécialisé mais plus restreint que PyTorch | Industrie où Python est un goulot d'étranglement | Mises à jour cohérentes avec PyTorch | Sécurité améliorée sans Python complet | Hérite du support CUDA de PyTorch |
| ONNX | Variable selon le runtime | Élevée entre différents frameworks | Vaste écosystème, soutenu par de nombreuses organisations | Flexibilité entre les frameworks ML | Mises à jour régulières pour les nouvelles opérations | Assurer des pratiques de conversion et de déploiement sécurisées | Diverses optimisations matérielles |
| OpenVINO | Optimisé pour le matériel Intel | Idéal au sein de l'écosystème Intel | Solide dans le domaine de la vision par ordinateur | IoT et périphérie avec le matériel Intel | Mises à jour régulières pour le matériel Intel | Fonctionnalités robustes pour les applications sensibles | Adapté au matériel Intel |
| TensorRT | De premier ordre sur les GPU NVIDIA | Meilleur pour le matériel NVIDIA | Réseau solide grâce à NVIDIA | Inférence vidéo et image en temps réel | Mises à jour fréquentes pour les nouveaux GPU | Accent mis sur la sécurité | Conçu pour les GPU NVIDIA |
| CoreML | Optimisé pour le matériel Apple sur appareil | Exclusif à l'écosystème Apple | Support solide d'Apple et des développeurs | ML sur appareil sur les produits Apple | Mises à jour régulières d'Apple | Accent sur la confidentialité et la sécurité | Moteur neural et GPU Apple |
| TF SavedModel | Évolutif dans les environnements serveur | Large compatibilité dans l'écosystème TensorFlow | Support étendu dû à la popularité de TensorFlow | Service de modèles à grande échelle | Mises à jour régulières par Google et la communauté | Fonctionnalités robustes pour l'entreprise | Diverses accélérations matérielles |
| TF GraphDef | Stable pour les graphes de calcul statiques | S'intègre bien avec l'infrastructure TensorFlow | Ressources pour optimiser les graphes statiques | Scénarios nécessitant des graphes statiques | Mises à jour avec le noyau TensorFlow | Pratiques de sécurité établies par TensorFlow | Options d'accélération TensorFlow |
| TF Lite | Vitesse et efficacité sur mobile/embarqué | Large gamme de supports d'appareils | Communauté robuste, soutenue par Google | Applications mobiles avec une empreinte minimale | Dernières fonctionnalités pour mobile | Environnement sécurisé sur les appareils des utilisateurs finaux | GPU et DSP entre autres |
| TF Edge TPU | Optimisé pour le matériel Edge TPU de Google | Exclusif aux appareils Edge TPU | En pleine croissance avec Google et des ressources tierces | Appareils IoT nécessitant un traitement en temps réel | Améliorations pour le nouveau matériel Edge TPU | Sécurité IoT robuste de Google | Conçu sur mesure pour Google Coral |
| Hailo HEF | Spécifique au matériel et compilé en externe | Appareils Hailo et Raspberry Pi AI Kit | Hailo Developer Zone et Model Zoo | Déploiements Hailo existants | Hailo SDK et mises à jour du firmware | L'inférence sur l'appareil garde les données en local | Hailo NPU via des artefacts HEF |
| TF.js | Performance raisonnable dans le navigateur | Élevée avec les technologies web | Support des développeurs web et Node.js | Applications web interactives | Contributions de l'équipe et de la communauté TensorFlow | Modèle de sécurité de la plateforme web | Amélioré avec WebGL et d'autres API |
| PaddlePaddle | Compétitif, facile à utiliser et évolutif | Écosystème Baidu, large support d'applications | Croissance rapide, surtout en Chine | Marché chinois et traitement linguistique | Focus sur les applications d'IA chinoises | Met l'accent sur la confidentialité et la sécurité des données | Incluant les puces Kunlun de Baidu |
| MNN | Haute performance pour les appareils mobiles. | Systèmes mobiles et embarqués ARM et CPU X86-64 | Communauté ML mobile/embarqué | Efficacité des systèmes mobiles | Maintenance haute performance sur les appareils mobiles | Avantages de la sécurité sur l'appareil | Optimisations pour CPU et GPU ARM |
| NCNN | Optimisé pour les appareils mobiles basés sur ARM | Systèmes mobiles et embarqués ARM | Communauté ML mobile/embarqué de niche mais active | Efficacité des systèmes Android et ARM | Maintenance haute performance sur ARM | Avantages de la sécurité sur l'appareil | Optimisations pour CPU et GPU ARM |
Cette analyse comparative te donne une vue d'ensemble. Pour le déploiement, il est essentiel de prendre en compte les exigences et contraintes spécifiques de ton projet, et de consulter la documentation détaillée ainsi que les ressources disponibles pour chaque option.
Link to this sectionCommunauté et support#
Lorsque tu commences avec YOLO26, avoir une communauté et un support utiles peut faire une réelle différence. Voici comment entrer en contact avec d'autres personnes partageant tes centres d'intérêt et obtenir l'aide dont tu as besoin.
Link to this sectionInteragis avec la communauté au sens large#
- GitHub Discussions : Le dépôt YOLO26 sur GitHub dispose d'une section "Discussions" où tu peux poser tes questions, signaler des problèmes et suggérer des améliorations.
- Serveur Discord Ultralytics : Ultralytics possède un serveur Discord où tu peux échanger avec d'autres utilisateurs et développeurs.
Link to this sectionDocumentation officielle et ressources#
- Docs Ultralytics YOLO26 : La documentation officielle fournit une vue d'ensemble complète de YOLO26, accompagnée de guides sur l'installation, l'utilisation et le dépannage.
Ces ressources t'aideront à relever les défis et à rester à jour sur les dernières tendances et les meilleures pratiques au sein de la communauté YOLO26.
Link to this sectionConclusion#
Dans ce guide, nous avons exploré les différentes options de déploiement pour YOLO26. Nous avons également discuté des facteurs importants à considérer lors de ton choix. Ces options te permettent de personnaliser ton modèle pour divers environnements et exigences de performance, le rendant adapté aux applications du monde réel.
N'oublie pas que la communauté YOLO26 et Ultralytics est une source précieuse d'aide. Entre en contact avec d'autres développeurs et experts pour découvrir des astuces et des solutions uniques que tu ne trouverais pas dans la documentation classique. Continue de chercher à apprendre, d'explorer de nouvelles idées et de partager tes expériences.
Link to this sectionFAQ#
Link to this sectionQuelles sont les options de déploiement disponibles pour YOLO26 sur différentes plateformes matérielles ?#
Ultralytics YOLO26 prend en charge divers formats de déploiement, chacun étant conçu pour des environnements et des plateformes matérielles spécifiques. Les principaux formats incluent :
- PyTorch pour la recherche et le prototypage, avec une excellente intégration Python.
- TorchScript pour les environnements de production où Python n'est pas disponible.
- ONNX pour la compatibilité multiplateforme et l'accélération matérielle.
- OpenVINO pour des performances optimisées sur le matériel Intel.
- TensorRT pour une inférence à haute vitesse sur les GPU NVIDIA.
Chaque format a des avantages uniques. Pour une présentation détaillée, consulte notre documentation sur le processus d'exportation.
Link to this sectionComment améliorer la vitesse d'inférence de mon modèle YOLO26 sur un CPU Intel ?#
Pour améliorer la vitesse d'inférence sur les CPU Intel, tu peux déployer ton modèle YOLO26 en utilisant la boîte à outils OpenVINO d'Intel. OpenVINO offre des gains de performance significatifs en optimisant les modèles pour tirer efficacement parti du matériel Intel.
- Convertis ton modèle YOLO26 au format OpenVINO en utilisant la fonction
model.export(). - Suis le guide de configuration détaillé dans la documentation d'exportation Intel OpenVINO.
Pour plus d'informations, jette un œil à notre article de blog.
Link to this sectionPuis-je déployer des modèles YOLO26 sur des appareils mobiles ?#
Oui, les modèles YOLO26 peuvent être déployés sur des appareils mobiles en utilisant TensorFlow Lite (TF Lite) pour les plateformes Android et iOS. TF Lite est conçu pour les appareils mobiles et embarqués, offrant une inférence efficace sur l'appareil.
# Export command for TFLite format
model.export(format="tflite")Pour plus de détails sur le déploiement de modèles sur mobile, consulte notre guide d'intégration TF Lite.
Link to this sectionQuels facteurs dois-je prendre en compte lors du choix d'un format de déploiement pour mon modèle YOLO26 ?#
Lors du choix d'un format de déploiement pour YOLO26, prends en compte les facteurs suivants :
- Performance : Certains formats comme TensorRT offrent des vitesses exceptionnelles sur les GPU NVIDIA, tandis qu'OpenVINO est optimisé pour le matériel Intel.
- Compatibilité : ONNX offre une large compatibilité entre différentes plateformes.
- Facilité d'intégration : Des formats comme CoreML ou TF Lite sont adaptés à des écosystèmes spécifiques comme iOS et Android, respectivement.
- Support de la communauté : Des formats comme PyTorch et TensorFlow disposent de ressources et d'un support communautaire étendus.
Pour une analyse comparative, consulte notre documentation sur les formats d'exportation.
Link to this sectionComment puis-je déployer des modèles YOLO26 dans une application web ?#
Pour déployer des modèles YOLO26 dans une application web, tu peux utiliser TensorFlow.js (TF.js), qui permet d'exécuter des modèles de machine learning directement dans le navigateur. Cette approche élimine le besoin d'infrastructure backend et offre des performances en temps réel.
- Exporte le modèle YOLO26 au format TF.js.
- Intègre le modèle exporté dans ton application web.
Pour des instructions étape par étape, consulte notre guide sur l'intégration TensorFlow.js.