Analyse comparative des options de déploiement de YOLO26
Introduction
Tu as parcouru un long chemin avec YOLO26. Tu as collecté tes données avec diligence, tu les as annotées minutieusement et tu as consacré le temps nécessaire pour entraîner et évaluer rigoureusement ton modèle YOLO26 personnalisé. À présent, il est temps de faire fonctionner ton modèle pour ton application, ton cas d'usage ou ton projet spécifique. Cependant, une décision cruciale se présente à toi : comment exporter et déployer ton modèle efficacement.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Ce guide te présente les options de déploiement de YOLO26 et les facteurs essentiels à prendre en compte pour choisir la bonne option pour ton projet.
Comment sélectionner la bonne option de déploiement pour ton modèle YOLO26
Au moment de déployer ton modèle YOLO26, choisir un format d'exportation adapté est très important. Comme indiqué dans la documentation des modes d'Ultralytics YOLO26, la fonction model.export() te permet de convertir ton modèle entraîné dans une variété de formats conçus pour divers environnements et exigences de performance.
Le format idéal dépend du contexte opérationnel prévu pour ton modèle, en équilibrant la vitesse, les contraintes matérielles et la facilité d'intégration. Pour un déploiement géré sans exportation manuelle, Ultralytics Platform propose des points de terminaison d'inférence prêts à l'emploi avec mise à l'échelle automatique dans 43 régions mondiales. Dans la section suivante, nous examinerons de plus près chaque option d'exportation, afin de comprendre quand choisir chacune d'entre elles.
Options de déploiement de YOLO26
Passons en revue les différentes options de déploiement de YOLO26. Pour un guide détaillé du processus d'exportation, consulte la page de documentation d'Ultralytics sur l'exportation.
PyTorch
PyTorch est une bibliothèque open-source d'apprentissage automatique largement utilisée pour des applications en deep learning et en intelligence artificielle. Elle offre un haut niveau de flexibilité et de rapidité, ce qui en fait l'outil préféré des chercheurs et des développeurs.
- Benchmarks de performance : PyTorch est reconnu pour sa facilité d'utilisation et sa flexibilité, ce qui peut entraîner un léger compromis sur la performance brute par rapport à d'autres frameworks plus spécialisés et optimisés.
- Compatibilité et intégration : Offre une excellente compatibilité avec diverses bibliothèques de science des données et d'apprentissage automatique en Python.
- Support communautaire et écosystème : L'une des communautés les plus dynamiques, avec des ressources étendues pour l'apprentissage et le dépannage.
- Études de cas : Couramment utilisé dans les prototypes de recherche, de nombreux articles universitaires font référence à des modèles déployés avec PyTorch.
- Maintenance et mises à jour : Mises à jour régulières avec un développement actif et un support pour les nouvelles fonctionnalités.
- Considérations de sécurité : Correctifs réguliers pour les problèmes de sécurité, mais la sécurité dépend en grande partie de l'environnement global dans lequel il est déployé.
- Accélération matérielle : Prend en charge CUDA pour l'accélération GPU, indispensable pour accélérer l'entraînement du modèle et l'inférence.
TorchScript
TorchScript étend les capacités de PyTorch en permettant l'exportation de modèles pour être exécutés dans un environnement d'exécution C++. Cela le rend adapté aux environnements de production où Python n'est pas disponible.
- Benchmarks de performance : Peut offrir de meilleures performances que PyTorch natif, surtout dans les environnements de production.
- Compatibilité et intégration : Conçu pour une transition fluide de PyTorch vers des environnements de production C++, bien que certaines fonctionnalités avancées puissent ne pas se traduire parfaitement.
- Support communautaire et écosystème : Bénéficie de la large communauté de PyTorch mais possède un cercle plus restreint de développeurs spécialisés.
- Études de cas : Largement utilisé dans les contextes industriels où la surcharge de performance de Python constitue un goulot d'étranglement.
- Maintenance et mises à jour : Maintenu parallèlement à PyTorch avec des mises à jour cohérentes.
- Considérations de sécurité : Offre une sécurité améliorée en permettant l'exécution de modèles dans des environnements sans installation complète de Python.
- Accélération matérielle : Hérite du support CUDA de PyTorch, assurant une utilisation efficace du GPU.
ONNX
L'Open Neural Network Exchange (ONNX) est un format qui permet l'interopérabilité des modèles entre différents frameworks, ce qui peut être crucial lors du déploiement sur diverses plateformes.
- Benchmarks de performance : Les modèles ONNX peuvent présenter une performance variable en fonction de l'environnement d'exécution spécifique sur lequel ils sont déployés.
- Compatibilité et intégration : Haute interopérabilité entre de multiples plateformes et matériels grâce à sa nature agnostique vis-à-vis des frameworks.
- Support communautaire et écosystème : Soutenu par de nombreuses organisations, ce qui conduit à un vaste écosystème et à une variété d'outils d'optimisation.
- Études de cas : Fréquemment utilisé pour déplacer des modèles entre différents frameworks d'apprentissage automatique, démontrant sa flexibilité.
- Maintenance et mises à jour : En tant que standard ouvert, ONNX est régulièrement mis à jour pour prendre en charge de nouvelles opérations et modèles.
- Considérations de sécurité : Comme pour tout outil multiplateforme, il est essentiel d'assurer des pratiques sécurisées dans le pipeline de conversion et de déploiement.
- Accélération matérielle : Avec ONNX Runtime, les modèles peuvent tirer parti de diverses optimisations matérielles.
OpenVINO
OpenVINO est une boîte à outils Intel conçue pour faciliter le déploiement de modèles de deep learning sur du matériel Intel, améliorant ainsi les performances et la vitesse.
- Benchmarks de performance : Spécifiquement optimisé pour les CPU, GPU et VPU Intel, offrant des gains de performance significatifs sur le matériel compatible.
- Compatibilité et intégration : Fonctionne mieux au sein de l'écosystème Intel mais prend également en charge une gamme d'autres plateformes.
- Support communautaire et écosystème : Soutenu par Intel, avec une solide base d'utilisateurs, en particulier dans le domaine de la computer vision.
- Études de cas : Souvent utilisé dans les scénarios d'IoT et d'edge computing où le matériel Intel est prédominant.
- Maintenance et mises à jour : Intel met régulièrement à jour OpenVINO pour prendre en charge les derniers modèles de deep learning et le matériel Intel.
- Considérations de sécurité : Fournit des fonctionnalités de sécurité robustes adaptées au déploiement dans des applications sensibles.
- Accélération matérielle : Adapté pour l'accélération sur le matériel Intel, en tirant parti de jeux d'instructions dédiés et de fonctionnalités matérielles.
Pour plus de détails sur le déploiement avec OpenVINO, réfère-toi à la documentation d'intégration d'Ultralytics : Intel OpenVINO Export.
TensorRT
TensorRT est un optimiseur d'inférence de deep learning haute performance et un environnement d'exécution de NVIDIA, idéal pour les applications nécessitant vitesse et efficacité.
- Benchmarks de performance : Offre des performances de premier ordre sur les GPU NVIDIA avec un support pour l'inférence à haute vitesse.
- Compatibilité et intégration : Mieux adapté au matériel NVIDIA, avec un support limité en dehors de cet environnement.
- Support communautaire et écosystème : Réseau de support solide grâce aux forums de développeurs et à la documentation de NVIDIA.
- Études de cas : Largement adopté dans les industries nécessitant une inférence en temps réel sur des données vidéo et images.
- Maintenance et mises à jour : NVIDIA maintient TensorRT avec des mises à jour fréquentes pour améliorer les performances et prendre en charge les nouvelles architectures GPU.
- Considérations de sécurité : Comme beaucoup de produits NVIDIA, il met l'accent sur la sécurité, mais les détails dépendent de l'environnement de déploiement.
- Accélération matérielle : Conçu exclusivement pour les GPU NVIDIA, offrant une optimisation et une accélération poussées.
Pour plus d'informations sur le déploiement avec TensorRT, consulte le guide d'intégration TensorRT.
CoreML
CoreML est le framework d'apprentissage automatique d'Apple, optimisé pour la performance sur appareil dans l'écosystème Apple, incluant iOS, macOS, watchOS et tvOS.
- Benchmarks de performance : Optimisé pour la performance sur appareil sur le matériel Apple avec une consommation de batterie minimale.
- Compatibilité et intégration : Exclusivement destiné à l'écosystème Apple, offrant un flux de travail rationalisé pour les applications iOS et macOS.
- Support communautaire et écosystème : Fort soutien d'Apple et d'une communauté de développeurs dédiée, avec une documentation et des outils étendus.
- Études de cas : Couramment utilisé dans les applications nécessitant des capacités d'apprentissage automatique sur appareil sur les produits Apple.
- Maintenance et mises à jour : Régulièrement mis à jour par Apple pour prendre en charge les dernières avancées en apprentissage automatique et le matériel Apple.
- Considérations de sécurité : Bénéficie de l'accent mis par Apple sur la confidentialité des utilisateurs et la data security.
- Accélération matérielle : Tire pleinement parti du moteur neuronal et du GPU d'Apple pour les tâches d'apprentissage automatique accélérées.
TF SavedModel
TF SavedModel est le format de TensorFlow pour enregistrer et servir des modèles d'apprentissage automatique, particulièrement adapté aux environnements de serveur évolutifs.
- Benchmarks de performance : Offre des performances évolutives dans les environnements de serveur, surtout lorsqu'il est utilisé avec TensorFlow Serving.
- Compatibilité et intégration : Large compatibilité dans tout l'écosystème de TensorFlow, y compris pour les déploiements cloud et serveur d'entreprise.
- Support communautaire et écosystème : Support d'une grande communauté grâce à la popularité de TensorFlow, avec une vaste gamme d'outils pour le déploiement et l'optimisation.
- Études de cas : Utilisé de manière intensive dans les environnements de production pour servir des modèles de deep learning à grande échelle.
- Maintenance et mises à jour : Soutenu par Google et la communauté TensorFlow, garantissant des mises à jour régulières et de nouvelles fonctionnalités.
- Considérations de sécurité : Le déploiement utilisant TensorFlow Serving inclut des fonctionnalités de sécurité robustes pour les applications d'entreprise.
- Accélération matérielle : Prend en charge diverses accélérations matérielles via les backends de TensorFlow.
TF GraphDef
TF GraphDef est un format TensorFlow qui représente le modèle sous forme de graphe, ce qui est bénéfique pour les environnements où un graphe de calcul statique est requis.
- Benchmarks de performance : Fournit des performances stables pour les graphes de calcul statiques, avec un accent sur la cohérence et la fiabilité.
- Compatibilité et intégration : S'intègre facilement au sein de l'infrastructure de TensorFlow mais est moins flexible comparé à SavedModel.
- Support communautaire et écosystème : Bon support de l'écosystème TensorFlow, avec de nombreuses ressources disponibles pour optimiser les graphes statiques.
- Études de cas : Utile dans les scénarios où un graphe statique est nécessaire, comme dans certains systèmes embarqués.
- Maintenance et mises à jour : Mises à jour régulières parallèlement aux mises à jour principales de TensorFlow.
- Considérations de sécurité : Assure un déploiement sûr grâce aux pratiques de sécurité établies de TensorFlow.
- Accélération matérielle : Peut utiliser les options d'accélération matérielle de TensorFlow, bien que ce ne soit pas aussi flexible que SavedModel.
Apprends-en plus sur TF GraphDef dans notre guide d'intégration TF GraphDef.
TF Lite
TF Lite est la solution de TensorFlow pour l'apprentissage automatique sur appareils mobiles et embarqués, fournissant une bibliothèque légère pour l'inférence sur appareil.
- Benchmarks de performance : Conçu pour la vitesse et l'efficacité sur les appareils mobiles et embarqués.
- Compatibilité et intégration : Peut être utilisé sur une large gamme d'appareils grâce à sa nature légère.
- Support communautaire et écosystème : Soutenu par Google, il dispose d'une communauté robuste et d'un nombre croissant de ressources pour les développeurs.
- Études de cas : Populaire dans les applications mobiles qui nécessitent une inférence sur appareil avec une empreinte minimale.
- Maintenance et mises à jour : Régulièrement mis à jour pour inclure les dernières fonctionnalités et optimisations pour les appareils mobiles.
- Considérations de sécurité : Fournit un environnement sécurisé pour exécuter des modèles sur les appareils des utilisateurs finaux.
- Accélération matérielle : Prend en charge une variété d'options d'accélération matérielle, incluant GPU et DSP.
TF Edge TPU
TF Edge TPU est conçu pour un calcul rapide et efficace sur le matériel Edge TPU de Google, parfait pour les appareils IoT nécessitant un traitement en temps réel.
- Benchmarks de performance : Spécifiquement optimisé pour un calcul rapide et efficace sur le matériel Edge TPU de Google.
- Compatibilité et intégration : Fonctionne exclusivement avec les modèles TensorFlow Lite sur les appareils Edge TPU.
- Support communautaire et écosystème : Soutien croissant avec des ressources fournies par Google et des développeurs tiers.
- Études de cas : Utilisé dans les appareils IoT et les applications qui nécessitent un traitement en temps réel avec une faible latence.
- Maintenance et mises à jour : Continuellement amélioré pour tirer parti des capacités des nouvelles versions matérielles Edge TPU.
- Considérations de sécurité : S'intègre à la sécurité robuste de Google pour l'IoT et les appareils edge.
- Accélération matérielle : Conçu sur mesure pour tirer pleinement parti des appareils Google Coral.
TF.js
TensorFlow.js (TF.js) est une bibliothèque qui apporte les capacités d'apprentissage automatique directement dans le navigateur, offrant un nouveau champ de possibilités pour les développeurs web et les utilisateurs. Elle permet l'intégration de modèles d'apprentissage automatique dans les applications web sans avoir besoin d'infrastructure backend.
- Benchmarks de performance : Permet l'apprentissage automatique directement dans le navigateur avec des performances raisonnables, selon l'appareil client.
- Compatibilité et intégration : Haute compatibilité avec les technologies web, permettant une intégration facile dans les applications web.
- Support communautaire et écosystème : Soutien d'une communauté de développeurs web et Node.js, avec une variété d'outils pour déployer des modèles ML dans les navigateurs.
- Études de cas : Idéal pour les applications web interactives qui bénéficient de l'apprentissage automatique côté client sans nécessiter de traitement côté serveur.
- Maintenance et mises à jour : Maintenu par l'équipe TensorFlow avec les contributions de la communauté open-source.
- Considérations de sécurité : S'exécute dans le contexte sécurisé du navigateur, en utilisant le modèle de sécurité de la plateforme web.
- Accélération matérielle : La performance peut être améliorée avec des API web qui accèdent à l'accélération matérielle comme WebGL.
PaddlePaddle
PaddlePaddle est un framework d'apprentissage profond open-source développé par Baidu. Il est conçu pour être à la fois efficace pour les chercheurs et facile à utiliser pour les développeurs. Il est particulièrement populaire en Chine et offre un support spécialisé pour le traitement de la langue chinoise.
- Bancs d'essai de performance : Offre des performances compétitives en mettant l'accent sur la facilité d'utilisation et l'évolutivité.
- Compatibilité et intégration : Bien intégré dans l'écosystème de Baidu et prend en charge une large gamme d'applications.
- Support communautaire et écosystème : Bien que la communauté soit plus petite à l'échelle mondiale, elle se développe rapidement, surtout en Chine.
- Études de cas : Couramment utilisé sur les marchés chinois et par les développeurs à la recherche d'alternatives aux autres frameworks majeurs.
- Maintenance et mises à jour : Régulièrement mis à jour avec un accent sur le service aux applications et services d'IA en langue chinoise.
- Considérations de sécurité : Met l'accent sur la confidentialité des données et la sécurité, répondant aux normes de gouvernance des données chinoises.
- Accélération matérielle : Prend en charge diverses accélérations matérielles, y compris les puces Kunlun de Baidu.
MNN
MNN est un framework d'apprentissage profond hautement efficace et léger. Il prend en charge l'inférence et l'entraînement de modèles d'apprentissage profond et possède des performances de pointe pour l'inférence et l'entraînement sur appareil. De plus, MNN est également utilisé sur des appareils embarqués, tels que l'IoT.
- Bancs d'essai de performance : Haute performance pour les appareils mobiles avec une excellente optimisation pour les systèmes ARM.
- Compatibilité et intégration : Fonctionne bien avec les systèmes ARM mobiles et embarqués ainsi qu'avec les architectures CPU X86-64.
- Support communautaire et écosystème : Soutenu par la communauté d'apprentissage automatique mobile et embarqué.
- Études de cas : Idéal pour les applications nécessitant une performance efficace sur les systèmes mobiles.
- Maintenance et mises à jour : Régulièrement maintenu pour assurer une haute performance sur les appareils mobiles.
- Considérations de sécurité : Offre des avantages de sécurité sur l'appareil en gardant les données locales.
- Accélération matérielle : Optimisé pour les CPU et GPU ARM pour une efficacité maximale.
NCNN
NCNN est un framework d'inférence de réseau neuronal haute performance optimisé pour la plateforme mobile. Il se distingue par sa légèreté et son efficacité, ce qui le rend particulièrement bien adapté aux appareils mobiles et embarqués où les ressources sont limitées.
- Bancs d'essai de performance : Hautement optimisé pour les plateformes mobiles, offrant une inférence efficace sur les appareils basés sur ARM.
- Compatibilité et intégration : Adapté aux applications sur téléphones mobiles et systèmes embarqués avec architecture ARM.
- Support communautaire et écosystème : Soutenu par une communauté de niche mais active, concentrée sur les applications ML mobiles et embarquées.
- Études de cas : Prisé pour les applications mobiles où l'efficacité et la vitesse sont critiques sur Android et autres systèmes basés sur ARM.
- Maintenance et mises à jour : Continuellement amélioré pour maintenir une haute performance sur une gamme d'appareils ARM.
- Considérations de sécurité : Se concentre sur l'exécution locale sur l'appareil, tirant parti de la sécurité inhérente au traitement sur appareil.
- Accélération matérielle : Adapté aux CPU et GPU ARM, avec des optimisations spécifiques pour ces architectures.
Analyse comparative des options de déploiement de YOLO26
Le tableau suivant fournit un aperçu des différentes options de déploiement disponibles pour les modèles YOLO26, t'aidant à évaluer celle qui pourrait le mieux répondre aux besoins de ton projet en fonction de plusieurs critères critiques. Pour un examen approfondi du format de chaque option de déploiement, consulte la page de documentation d'Ultralytics sur les formats d'exportation.
| Option de déploiement | Benchmarks de performance | Compatibilité et intégration | Support communautaire et écosystème | Études de cas | Maintenance et mises à jour | Considérations de sécurité | Accélération matérielle |
|---|---|---|---|---|---|---|---|
| PyTorch | Bonne flexibilité ; peut compromettre la performance brute | Excellent avec les bibliothèques Python | Ressources et communauté étendues | Recherche et prototypes | Développement régulier et actif | Dépendant de l'environnement de déploiement | Support CUDA pour l'accélération GPU |
| TorchScript | Meilleur pour la production que PyTorch | Transition en douceur de PyTorch vers C++ | Spécialisé mais plus restreint que PyTorch | Industrie où Python est un goulot d'étranglement | Mises à jour cohérentes avec PyTorch | Sécurité améliorée sans Python complet | Hérite du support CUDA de PyTorch |
| ONNX | Variable selon l'exécution | Élevé à travers différents frameworks | Écosystème vaste, soutenu par de nombreuses organisations | Flexibilité entre les frameworks ML | Mises à jour régulières pour les nouvelles opérations | Assurer des pratiques de conversion et de déploiement sécurisées | Diverses optimisations matérielles |
| OpenVINO | Optimisé pour le matériel Intel | Meilleur au sein de l'écosystème Intel | Solide dans le domaine de la vision par ordinateur | IoT et périphérie avec le matériel Intel | Mises à jour régulières pour le matériel Intel | Fonctionnalités robustes pour les applications sensibles | Adapté pour le matériel Intel |
| TensorRT | Au sommet sur les GPU NVIDIA | Meilleur pour le matériel NVIDIA | Réseau solide via NVIDIA | Inférence vidéo et image en temps réel | Mises à jour fréquentes pour les nouveaux GPU | Accent sur la sécurité | Conçu pour les GPU NVIDIA |
| CoreML | Optimisé pour le matériel Apple sur appareil | Exclusif à l'écosystème Apple | Soutien solide d'Apple et des développeurs | ML sur appareil sur les produits Apple | Mises à jour Apple régulières | Accent sur la confidentialité et la sécurité | Moteur neuronal et GPU Apple |
| TF SavedModel | Évolutif dans les environnements serveurs | Large compatibilité dans l'écosystème TensorFlow | Support important grâce à la popularité de TensorFlow | Service de modèles à grande échelle | Mises à jour régulières par Google et la communauté | Fonctionnalités robustes pour l'entreprise | Diverses accélérations matérielles |
| TF GraphDef | Stable pour les graphes de calcul statiques | S'intègre bien avec l'infrastructure TensorFlow | Ressources pour optimiser les graphes statiques | Scénarios nécessitant des graphes statiques | Mises à jour parallèlement au cœur de TensorFlow | Pratiques de sécurité TensorFlow établies | Options d'accélération TensorFlow |
| TF Lite | Vitesse et efficacité sur mobile/embarqué | Large gamme de support d'appareils | Communauté robuste, soutenu par Google | Applications mobiles avec une empreinte minimale | Dernières fonctionnalités pour mobile | Environnement sécurisé sur les appareils des utilisateurs finaux | GPU et DSP entre autres |
| TF Edge TPU | Optimisé pour le matériel Edge TPU de Google | Exclusif aux appareils Edge TPU | En pleine croissance avec Google et des ressources tierces | Appareils IoT nécessitant un traitement en temps réel | Améliorations pour le nouveau matériel Edge TPU | Sécurité IoT robuste de Google | Conçu sur mesure pour Google Coral |
| TF.js | Performance raisonnable dans le navigateur | Élevée avec les technologies web | Support des développeurs web et Node.js | Applications web interactives | Contributions de l'équipe TensorFlow et de la communauté | Modèle de sécurité de la plateforme web | Amélioré avec WebGL et d'autres API |
| PaddlePaddle | Compétitif, facile à utiliser et évolutif | Écosystème Baidu, large support d'applications | En croissance rapide, particulièrement en Chine | Marché chinois et traitement du langage | Focus sur les applications d'IA chinoises | Met l'accent sur la confidentialité et la sécurité des données | Incluant les puces Kunlun de Baidu |
| MNN | Haute performance pour les appareils mobiles. | Systèmes ARM mobiles et embarqués et CPU X86-64 | Communauté ML mobile/embarqué | Efficacité des systèmes mobiles | Maintenance haute performance sur appareils mobiles | Avantages de sécurité sur l'appareil | Optimisations pour CPU et GPU ARM |
| NCNN | Optimisé pour les appareils mobiles basés sur ARM | Systèmes mobiles et embarqués ARM | Communauté ML mobile/embarqué de niche mais active | Efficacité des systèmes Android et ARM | Maintenance haute performance sur ARM | Avantages de sécurité sur l'appareil | Optimisations pour CPU et GPU ARM |
Cette analyse comparative te donne une vue d'ensemble. Pour le déploiement, il est essentiel de considérer les exigences et contraintes spécifiques de ton projet, et de consulter la documentation détaillée ainsi que les ressources disponibles pour chaque option.
Communauté et support
Lorsque tu commences avec YOLO26, avoir une communauté utile et du support peut faire une réelle différence. Voici comment te connecter avec d'autres personnes partageant tes centres d'intérêt et obtenir l'aide dont tu as besoin.
Interagis avec la communauté au sens large
- GitHub Discussions : Le dépôt YOLO26 sur GitHub possède une section "Discussions" où tu peux poser des questions, signaler des problèmes et suggérer des améliorations.
- Serveur Discord d'Ultralytics : Ultralytics dispose d'un serveur Discord où tu peux interagir avec d'autres utilisateurs et développeurs.
Documentation officielle et ressources
- Docs d'Ultralytics YOLO26 : La documentation officielle fournit une vue d'ensemble complète de YOLO26, ainsi que des guides sur l'installation, l'utilisation et le dépannage.
Ces ressources t'aideront à surmonter les défis et à rester à jour sur les dernières tendances et meilleures pratiques au sein de la communauté YOLO26.
Conclusion
Dans ce guide, nous avons exploré les différentes options de déploiement pour YOLO26. Nous avons également discuté des facteurs importants à prendre en compte lors de ton choix. Ces options te permettent de personnaliser ton modèle pour divers environnements et exigences de performance, le rendant adapté aux applications réelles.
N'oublie pas que la communauté YOLO26 et Ultralytics est une source d'aide précieuse. Connecte-toi avec d'autres développeurs et experts pour apprendre des astuces uniques et trouver des solutions que tu ne trouverais pas dans la documentation classique. Continue à chercher des connaissances, à explorer de nouvelles idées et à partager tes expériences.
FAQ
Quelles sont les options de déploiement disponibles pour YOLO26 sur différentes plateformes matérielles ?
Ultralytics YOLO26 prend en charge divers formats de déploiement, chacun étant conçu pour des environnements et des plateformes matérielles spécifiques. Les formats clés incluent :
- PyTorch pour la recherche et le prototypage, avec une excellente intégration Python.
- TorchScript pour les environnements de production où Python n'est pas disponible.
- ONNX pour la compatibilité multiplateforme et l'accélération matérielle.
- OpenVINO pour une performance optimisée sur le matériel Intel.
- TensorRT pour une inférence à haute vitesse sur les GPU NVIDIA.
Chaque format a des avantages uniques. Pour une procédure détaillée, consulte notre documentation sur le processus d'exportation.
Comment puis-je améliorer la vitesse d'inférence de mon modèle YOLO26 sur un CPU Intel ?
Pour améliorer la vitesse d'inférence sur les CPU Intel, tu peux déployer ton modèle YOLO26 en utilisant le toolkit OpenVINO d'Intel. OpenVINO offre des gains de performance significatifs en optimisant les modèles pour exploiter efficacement le matériel Intel.
- Convertis ton modèle YOLO26 au format OpenVINO en utilisant la fonction
model.export(). - Suis le guide de configuration détaillé dans la documentation d'exportation Intel OpenVINO.
Pour plus d'informations, consulte notre article de blog.
Puis-je déployer des modèles YOLO26 sur des appareils mobiles ?
Oui, les modèles YOLO26 peuvent être déployés sur des appareils mobiles en utilisant TensorFlow Lite (TF Lite) pour les plateformes Android et iOS. TF Lite est conçu pour les appareils mobiles et embarqués, offrant une inférence efficace sur l'appareil.
# Export command for TFLite format
model.export(format="tflite")Pour plus de détails sur le déploiement de modèles sur mobile, reporte-toi à notre guide d'intégration TF Lite.
Quels facteurs dois-je considérer lors du choix d'un format de déploiement pour mon modèle YOLO26 ?
Lors du choix d'un format de déploiement pour YOLO26, considère les facteurs suivants :
- Performance : Certains formats comme TensorRT offrent des vitesses exceptionnelles sur les GPU NVIDIA, tandis qu'OpenVINO est optimisé pour le matériel Intel.
- Compatibilité : ONNX offre une large compatibilité sur différentes plateformes.
- Facilité d'intégration : Des formats comme CoreML ou TF Lite sont adaptés à des écosystèmes spécifiques comme iOS et Android, respectivement.
- Support de la communauté : Des formats comme PyTorch et TensorFlow disposent de ressources et d'un support communautaire étendus.
Pour une analyse comparative, consulte notre documentation sur les formats d'exportation.
Comment puis-je déployer des modèles YOLO26 dans une application web ?
Pour déployer des modèles YOLO26 dans une application web, tu peux utiliser TensorFlow.js (TF.js), qui permet d'exécuter des modèles de machine learning directement dans le navigateur. Cette approche élimine le besoin d'infrastructure backend et offre des performances en temps réel.
- Exporte le modèle YOLO26 au format TF.js.
- Intègre le modèle exporté dans ton application web.
Pour des instructions étape par étape, consulte notre guide sur l'intégration TensorFlow.js.