Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOv9 : La prochaine évolution de la détection d'objets en temps réel#

Le paysage de la vision par ordinateur progresse rapidement, avec de nouvelles architectures repoussant continuellement les limites de la vitesse et de la précision. Dans cette comparaison technique, nous examinons les différences entre YOLO26 et YOLOv9, deux modèles très influents dans le domaine de la détection d'objets en temps réel. Bien que les deux modèles proposent des innovations architecturales distinctes, comprendre leurs compromis en termes de performances, leurs capacités de déploiement et leurs exigences matérielles est crucial pour choisir le bon outil pour ton prochain projet de vision.

Link to this sectionYOLO26 : La puissance optimisée pour l'Edge#

Sorti début 2026, Ultralytics YOLO26 représente un saut générationnel en termes d'efficacité de déploiement et de stabilité d'entraînement des modèles. Conçu pour être un framework nativement de bout en bout (end-to-end), il résout directement les goulots d'étranglement de déploiement qui ont historiquement affecté les applications d'IA en périphérie (Edge AI).

Détails du modèle :

Link to this sectionArchitecture et innovations#

YOLO26 repense fondamentalement le pipeline de post-traitement en introduisant une conception de bout en bout sans NMS. En éliminant le besoin de NMS (Non-Maximum Suppression), le modèle atteint une variabilité de latence nettement plus faible. Cela facilite considérablement le déploiement sur les plateformes mobiles et edge, surtout lors de l'exportation vers des frameworks comme ONNX et Apple CoreML.

De plus, la suppression de la perte de distribution focale (DFL) rationalise le processus d'exportation et améliore la compatibilité avec les microcontrôleurs basse consommation. Pour améliorer la stabilité de l'entraînement, YOLO26 intègre le nouvel optimiseur MuSGD, un hybride de descente de gradient stochastique (SGD) et de Muon (inspiré par des innovations dans l'entraînement des grands modèles de langage). Cela permet une convergence plus rapide et une extraction de caractéristiques plus robuste sur des jeux de données difficiles.

Inférence sur appareil Edge

Grâce aux simplifications architecturales et à la suppression du DFL, YOLO26 permet une inférence CPU jusqu'à 43 % plus rapide, ce qui en fait le choix idéal pour les appareils edge aux ressources limitées comme le Raspberry Pi ou le NVIDIA Jetson Nano.

Pour détecter des éléments très difficiles dans des scènes comme l'imagerie aérienne par drone, YOLO26 utilise les fonctions de perte mises à jour ProgLoss + STAL. Celles-ci apportent des améliorations notables dans le rappel de reconnaissance des petits objets. De plus, il bénéficie d'améliorations spécifiques aux tâches, notamment le multi-scale proto pour la segmentation d'instances, l'estimation du log-vraisemblance résiduel (RLE) pour l'estimation de pose, et une perte angulaire spécialisée pour la détection de boîtes englobantes orientées (OBB).

En savoir plus sur YOLO26

Link to this sectionYOLOv9 : Programmable Gradient Information#

Introduit début 2024, YOLOv9 a apporté des avancées théoriques sur la manière dont les réseaux de neurones gèrent le flux de gradient pendant la phase d'entraînement, en se concentrant sur l'efficacité des paramètres et la rétention profonde des caractéristiques.

Détails du modèle :

Link to this sectionArchitecture et points forts#

YOLOv9 est construit autour du concept de Programmable Gradient Information (PGI) et du Generalized Efficient Layer Aggregation Network (GELAN). Ces concepts résolvent le problème du goulot d'étranglement de l'information souvent observé dans les réseaux de neurones profonds. En préservant les informations essentielles tout au long du processus de propagation vers l'avant, GELAN garantit que les gradients utilisés pour les mises à jour de poids restent fiables. Cette architecture offre une grande précision et fait de YOLOv9 un candidat sérieux pour la recherche académique sur la théorie des réseaux de neurones et l'optimisation des chemins de gradient en utilisant le framework PyTorch.

Link to this sectionLimites#

Malgré son excellente efficacité en termes de paramètres, YOLOv9 s'appuie fortement sur le NMS traditionnel pour le post-traitement des boîtes englobantes, ce qui peut créer des goulots d'étranglement computationnels lors de l'inférence sur les appareils edge. De plus, le dépôt officiel est largement axé sur la détection d'objets, nécessitant une ingénierie personnalisée importante pour l'adapter à des tâches spécialisées comme le tracking ou l'estimation de pose.

En savoir plus sur YOLOv9

Link to this sectionComparaison des performances#

Lors de l'évaluation de ces modèles pour un déploiement réel, il est crucial d'équilibrer la précision (mAP), la vitesse d'inférence et l'utilisation de la mémoire. Les modèles Ultralytics sont réputés pour leurs faibles besoins en mémoire pendant l'entraînement et l'inférence, nécessitant beaucoup moins de mémoire CUDA que les alternatives basées sur les Transformer comme RT-DETR.

Tu trouveras ci-dessous une comparaison directe des performances de YOLO26 et YOLOv9 sur le jeu de données COCO. Les meilleures valeurs dans chaque colonne sont indiquées en gras.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040,938.91.72,45.4
YOLO26s64048,687.22.59,520,7
YOLO26m64053,1220.04.720,468,2
YOLO26l64055,0286.26.224,886,4
YOLO26x64057.5525.811.855,7193,9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Remarque : Les vitesses CPU pour YOLOv9 sont omises car elles varient considérablement en fonction de la configuration du NMS et sont généralement plus lentes que l'implémentation native sans NMS de YOLO26.

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLO26 et YOLOv9 dépend des exigences spécifiques de ton projet, de tes contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLO26#

YOLO26 est un choix judicieux pour :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionQuand choisir YOLOv9#

YOLOv9 est recommandé pour :

  • Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
  • Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Link to this sectionL'avantage Ultralytics#

Choisir un modèle implique bien plus que la simple lecture d'un benchmark de précision ; l'écosystème logiciel environnant dicte la rapidité avec laquelle tu peux passer de la collecte de données à la production.

Link to this sectionFacilité d'utilisation et écosystème#

L'API Python Ultralytics offre une expérience fluide. Au lieu de cloner des dépôts complexes ou de configurer manuellement des scripts d'entraînement distribués, les développeurs peuvent installer le package via pip et commencer à entraîner immédiatement. L'écosystème Ultralytics, activement maintenu, garantit des mises à jour fréquentes, des intégrations automatisées avec des plateformes ML comme Weights & Biases et une documentation complète.

Autres modèles Ultralytics

Si tu souhaites explorer d'autres modèles au sein de l'écosystème Ultralytics, tu pourrais également envisager de comparer YOLO11 ou le classique YOLOv8, qui offrent tous deux une flexibilité exceptionnelle pour les applications personnalisées.

Link to this sectionPolyvalence pour les tâches de vision#

Alors que YOLOv9 est principalement un moteur de détection, YOLO26 est un outil de vision polyvalent. En utilisant une syntaxe unique et unifiée, tu peux facilement passer de la détection d'objets à la segmentation d'image précise au pixel près ou à la classification d'image entière. Cette polyvalence réduit la dette technique liée à la maintenance de plusieurs bases de code disparates pour différentes fonctionnalités de vision par ordinateur.

Link to this sectionEntraînement et déploiement efficaces#

L'efficacité de l'entraînement est une pierre angulaire de la philosophie Ultralytics. YOLO26 utilise des poids pré-entraînés facilement disponibles et affiche une utilisation de la mémoire nettement inférieure à celle des vision transformers encombrants. Une fois entraînés, les pipelines d'exportation intégrés permettent des conversions en un clic vers des formats optimisés comme TensorRT ou TensorFlow Lite, facilitant ainsi le chemin vers la production.

Link to this sectionExemple de code : Démarrer avec YOLO26#

L'implémentation de YOLO26 est remarquablement simple. L'extrait Python suivant montre comment charger un modèle pré-entraîné, l'entraîner sur des données personnalisées et exécuter l'inférence en utilisant l'API Ultralytics.

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Uses GPU 0, or use 'cpu' for CPU training
)

# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes and confidences
predictions[0].show()

En tirant parti de la vitesse, de l'architecture simplifiée et de l'écosystème robuste de YOLO26, les équipes peuvent mettre sur le marché des applications d'IA de vision avancées plus rapidement et avec moins d'obstacles techniques que jamais auparavant.

Contributeurs

Commentaires