Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOX#

Le domaine de la vision par ordinateur a connu une évolution rapide des architectures de détection d'objets en temps réel. Ce guide propose une comparaison complète entre YOLOv9 et YOLOX, en analysant leurs innovations architecturales, leurs métriques de performance et leurs méthodologies d'entraînement. Que tu développes des applications intelligentes pour l'IA dans l'industrie manufacturière ou que tu explores la modélisation prédictive, la compréhension de ces modèles t'aidera à prendre des décisions éclairées pour ton prochain déploiement.

Link to this sectionInnovations architecturales#

Link to this sectionYOLOv9 : Programmable Gradient Information#

YOLOv9 a introduit un changement de paradigme en résolvant le problème du goulot d'étranglement de l'information inhérent aux réseaux de neurones profonds. Ses principales innovations incluent la Programmable Gradient Information (PGI) et le Generalized Efficient Layer Aggregation Network (GELAN).

  • Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica, Taïwan
  • Date : 21 février 2024
  • Arxiv : 2402.13616
  • GitHub : WongKinYiu/yolov9

En conservant des données de caractéristiques cruciales pendant le processus de propagation vers l'avant (feed-forward), YOLOv9 garantit que les gradients utilisés pour mettre à jour les poids lors de la rétropropagation restent précis. Cette architecture excelle dans l'extraction de caractéristiques, ce qui la rend hautement capable de détecter de petits objets dans des environnements complexes, tels que ceux rencontrés dans l'imagerie aérienne et les scans médicaux détaillés.

En savoir plus sur YOLOv9

Link to this sectionYOLOX : Relier la recherche et l'industrie#

Sorti mi-2021, YOLOX a orienté la série YOLO vers une conception sans ancres (anchor-free). Il a introduit une tête découplée, qui sépare les tâches de classification et de localisation, et a utilisé la stratégie d'assignation de labels SimOTA pour améliorer la convergence de l'entraînement.

Bien que YOLOX ait été révolutionnaire pour son époque, atteignant une excellente précision moyenne (mAP) et éliminant le réglage des hyperparamètres des ancres, son architecture sous-jacente a depuis été surpassée par des réseaux modernes qui équilibrent mieux le nombre de paramètres et la rétention de caractéristiques.

En savoir plus sur YOLOX

Évolution sans ancres

YOLOX et les nouveaux modèles Ultralytics adoptent tous deux des conceptions sans ancres, réduisant la complexité du réglage des hyperparamètres et améliorant la généralisation sur divers jeux de données.

Link to this sectionAnalyse des performances#

Lors de la comparaison de ces modèles sur le benchmark MS COCO, les avancées de YOLOv9 deviennent évidentes. YOLOv9 atteint systématiquement un meilleur compromis entre précision et FLOPs.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Alors que YOLOX propose des variantes légères comme YOLOX-Nano pour les cas extrêmes à la périphérie (edge), les variantes de YOLOv9 surpassent systématiquement les modèles YOLOX de taille similaire en termes de précision pure. Par exemple, YOLOv9m atteint 51,4 % de mAP contre 49,7 % pour YOLOXl, bien qu'il ait moins de la moitié des paramètres (20,0M contre 54,2M).

Link to this sectionL'avantage Ultralytics#

Choisir un modèle implique bien plus que de la théorie architecturale ; l'écosystème qui l'entoure dicte la vitesse de développement et le succès du déploiement. L'utilisation de YOLOv9 au sein de l'écosystème Ultralytics offre une facilité d'utilisation inégalée et un support communautaire robuste.

Contrairement aux anciens dépôts de recherche originaux, le framework Ultralytics fournit une API Python unifiée qui simplifie les pipelines complexes. L'entraînement nécessite beaucoup moins de mémoire GPU que de nombreuses alternatives, offrant une efficacité d'entraînement incroyable.

from ultralytics import YOLO

# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to TensorRT format
model.export(format="engine")

Avec un support intégré pour plusieurs tâches, y compris la détection d'objets, la segmentation d'instances et l'estimation de pose, tu peux rapidement orienter tes solutions de vision par ordinateur sans changer toute ta base de code.

Exportation transparente

Tu déploies sur l'edge ? Ultralytics facilite l'exportation de tes modèles entraînés vers des formats hautement optimisés comme ONNX, TensorRT et OpenVINO avec une seule commande.

Link to this sectionApplications concrètes#

Les forces spécifiques de ces modèles les adaptent à des applications réelles distinctes :

Link to this sectionAnalytique de vente au détail à haute vitesse#

Pour les environnements de vente au détail modernes nécessitant une reconnaissance de produits en temps réel, YOLOv9 excelle. Sa capacité à conserver des détails de caractéristiques complexes le rend parfaitement adapté aux déploiements d'IA dans la vente au détail où il est nécessaire de distinguer des produits visuellement similaires sur une étagère encombrée.

Link to this sectionDéploiements Edge existants#

Dans les scénarios régis par des limitations matérielles strictes ou des NPU spécialisés qui ont du mal avec les nouveaux blocs d'agrégation, YOLOX-Nano peut parfois trouver une niche. Ses motifs de convolution purs et épurés sont parfois préférés pour des microcontrôleurs extrêmement limités en ressources.

Link to this sectionRobotique autonome#

Pour la navigation robotique, manquer de petits objets peut être catastrophique. L'architecture GELAN au sein de YOLOv9 garantit que les caractéristiques des petits obstacles distants ne sont pas perdues dans les couches profondes du réseau, surpassant les anciens modèles dans des environnements de sécurité critiques comme les applications d'IA dans l'automobile.

Link to this sectionCas d'utilisation et recommandations#

Choisir entre YOLOv9 et YOLOX dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOv9#

YOLOv9 est un choix solide pour :

  • Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
  • Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Link to this sectionQuand choisir YOLOX#

YOLOX est recommandé pour :

  • Recherche sur la détection sans ancres : La recherche académique utilisant l'architecture propre et sans ancres de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou des fonctions de perte.
  • Appareils en périphérie ultra-légers : Le déploiement sur des microcontrôleurs ou du matériel mobile ancien où l'empreinte extrêmement réduite de la variante YOLOX-Nano (0.91 M de paramètres) est critique.
  • Études sur l'assignation de labels SimOTA : Les projets de recherche étudiant les stratégies d'assignation de labels basées sur le transport optimal et leur impact sur la convergence de l'entraînement.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionL'avenir : Arrivée de YOLO26#

Bien que YOLOv9 représente une étape impressionnante, les exigences des environnements de production repoussent constamment les limites. Le tout nouveau YOLO26 représente la norme définitive pour l'IA de vision moderne.

YOLO26 revitalise complètement le pipeline de déploiement avec une conception native End-to-End NMS-Free. En éliminant le besoin d'une suppression non maximale (NMS) complexe lors du post-traitement, il offre une latence d'inférence nettement inférieure.

De plus, YOLO26 intègre l'innovant optimiseur MuSGD, un hybride de SGD et Muon qui emprunte des innovations à l'entraînement LLM pour offrir une convergence incroyablement stable et rapide. En supprimant la Distribution Focal Loss (DFL), YOLO26 atteint jusqu'à 43 % d'inférence CPU plus rapide par rapport à ses prédécesseurs, ce qui en fait le choix absolu pour les appareils edge et les déploiements d'entreprise. Avec des améliorations notables dans la reconnaissance de petits objets via ProgLoss et STAL, YOLO26 remplace efficacement YOLOX et YOLOv9.

Pour les ingénieurs explorant des architectures modernes, nous recommandons également de jeter un œil à YOLO11 et RT-DETR comme alternatives puissantes au sein de la suite Ultralytics. Assure-toi que ton projet est pérenne en tirant parti des performances inégalées des derniers modèles sur la plateforme Ultralytics.

Commentaires