Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOv5#

Le domaine de la vision par ordinateur a connu une croissance considérable, la détection d'objets servant de socle à d'innombrables applications industrielles et de recherche. Choisir la bonne architecture nécessite souvent une évaluation minutieuse de la précision moyenne (mAP), de la vitesse d'inférence et de la charge mémoire. Dans cette comparaison, nous explorons deux modèles très influents : YOLOv9, reconnu pour ses percées architecturales dans la rétention d'informations de gradient, et Ultralytics YOLOv5, le standard industriel éprouvé, célèbre pour sa facilité d'utilisation incroyable et sa polyvalence de déploiement inégalée.

Link to this sectionInnovations architecturales et origines techniques#

Comprendre les mécanismes sous-jacents de ces deux modèles fournit un contexte crucial pour leurs profils de performance respectifs.

Link to this sectionYOLOv9 : Programmable Gradient Information#

Développé par les chercheurs Chien-Yao Wang et Hong-Yuan Mark Liao à l'Institute of Information Science de l'Academia Sinica à Taïwan, YOLOv9 a été publié le 21 février 2024. Le modèle introduit deux concepts révolutionnaires pour résoudre le goulot d'étranglement de l'information courant dans les réseaux neuronaux profonds : Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).

En utilisant PGI, YOLOv9 garantit que les informations vitales sont conservées tout au long du processus feed-forward, ce qui conduit à des mises à jour de gradient très précises. Parallèlement, l'architecture GELAN maximise l'efficacité des paramètres, permettant au modèle d'atteindre une précision de pointe avec une charge computationnelle étonnamment faible. Tu peux explorer les détails techniques dans l'article Arxiv officiel de YOLOv9 ou consulter le dépôt GitHub de YOLOv9.

En savoir plus sur YOLOv9

Link to this sectionUltralytics YOLOv5 : Le standard de production#

Conçu par Glenn Jocher et publié par Ultralytics le 26 juin 2020, YOLOv5 a révolutionné l'accessibilité de la vision par ordinateur. En tant que l'un des premiers modèles de détection d'objets construits nativement sur le framework PyTorch, il a contourné les complexités de l'ancien framework C Darknet. YOLOv5 exploite un backbone CSPNet hautement optimisé et un neck PANet, privilégiant un équilibre parfait entre vitesse et précision.

Son accomplissement majeur, cependant, est son intégration dans l'écosystème plus large d'Ultralytics. YOLOv5 est fortement optimisé pour une efficacité d'entraînement rapide et des environnements à faible mémoire, ce qui le rend incroyablement stable pour les déploiements en périphérie (edge).

En savoir plus sur YOLOv5

Efficacité mémoire

Lors de l'évaluation de modèles pour des appareils en périphérie, souviens-toi que les modèles Ultralytics YOLO exigent généralement beaucoup moins de mémoire GPU pendant l'entraînement et l'inférence par rapport aux architectures lourdes basées sur les Transformers.

Link to this sectionAnalyse de performance : Vitesse vs Précision#

Lors de la conception d'un pipeline de vision par ordinateur, les développeurs doivent peser les compromis entre précision et latence. Le tableau suivant illustre les différences de performance sur le jeu de données COCO standard.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionAnalyse des compromis#

YOLOv9 établit une domination absolue en termes de précision brute. Le YOLOv9e repousse les limites du mAP jusqu'à 55,6 %, utilisant ses couches GELAN pour préserver les détails fins. Cela en fait un choix exceptionnel pour l'imagerie médicale ou les scénarios exigeant une précision rigoureuse sur de petits objets.

À l'inverse, YOLOv5 brille par sa vitesse de déploiement brute et sa flexibilité matérielle. Le YOLOv5n (Nano) est notoirement léger, exécutant des inférences en seulement 1,12 ms sur un GPU T4 via TensorRT. Si tu déploies sur des appareils IoT contraints, des téléphones mobiles ou Raspberry Pi, l'empreinte mémoire de YOLOv5 le rend extraordinairement fiable.

Link to this sectionL'avantage de l'écosystème Ultralytics#

Une considération majeure lors de la sélection d'un modèle est l'écosystème logiciel environnant. Bien que YOLOv9 fournisse des benchmarks de recherche de premier plan, l'utilisation des deux modèles via l'API Python Ultralytics moderne comble le fossé, offrant aux développeurs une expérience unifiée et rationalisée.

Link to this sectionFacilité d'utilisation et exportation#

Ultralytics résume les obstacles techniques complexes. Des fonctionnalités telles que l'augmentation des données automatique et le réglage des hyperparamètres sont gérées nativement. Le passage des modèles en production est tout aussi trivial, avec des commandes d'exportation intégrées pour convertir les modèles aux formats ONNX, OpenVINO ou TFLite.

Link to this sectionPolyvalence des tâches#

Bien que les deux modèles excellent dans la détection d'objets, les modèles Ultralytics modernes sont conçus pour relever divers défis de vision par ordinateur. Le framework plus large offre un support natif pour la classification d'images, la segmentation d'instances, l' estimation de pose et les boîtes englobantes orientées (OBB), permettant aux développeurs de résoudre plusieurs problèmes de vision sans changer de base de code.

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLOv9 et YOLOv5 dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOv9#

YOLOv9 est un choix solide pour :

  • Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
  • Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Link to this sectionQuand choisir YOLOv5#

YOLOv5 est recommandé pour :

  • Systèmes de production éprouvés : Déploiements existants où la longue expérience de stabilité de YOLOv5, sa documentation étendue et le soutien massif de la communauté sont valorisés.
  • Entraînement aux ressources limitées : Environnements avec des ressources GPU limitées où le pipeline d'entraînement efficace et les exigences mémoire inférieures de YOLOv5 sont avantageux.
  • Prise en charge étendue des formats d'exportation : Projets nécessitant un déploiement sur de nombreux formats, dont ONNX, TensorRT, CoreML et TFLite.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionExemple d'implémentation#

La beauté de l'écosystème Ultralytics est que tu peux passer d'un modèle YOLOv5 à un modèle YOLOv9 simplement en changeant la chaîne de poids.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionExplorer des architectures plus récentes#

Bien que YOLOv5 et YOLOv9 soient d'excellents modèles avec des avantages distincts, le domaine continue d'avancer. Les utilisateurs explorant de nouveaux projets pourraient également vouloir évaluer les dernières itérations d'Ultralytics.

  • YOLO11 : Une évolution puissante et raffinée de la lignée YOLOv8 offrant un excellent équilibre vitesse-précision pour toutes les tâches de vision.
  • YOLO26 : Publié en 2026, YOLO26 est la recommandation ultime pour les pipelines modernes. Il introduit une conception de bout en bout sans NMS, éliminant complètement les goulots d'étranglement liés au post-traitement. Avec la suppression de DFL (Distribution Focal Loss retirée pour une exportation simplifiée et une meilleure compatibilité avec les appareils en périphérie/basse consommation), il atteint une inférence CPU jusqu'à 43 % plus rapide. La stabilité de l'entraînement est boostée par le nouvel optimiseur MuSGD, et ProgLoss + STAL offre des fonctions de perte améliorées avec des avancées notables dans la reconnaissance de petits objets, essentielles pour l'IoT, la robotique et l'imagerie aérienne, ce qui en fait l'architecture la plus robuste pour les déploiements en périphérie et dans le cloud.

Pour les équipes gérant de grands jeux de données et des pipelines de déploiement complexes, l'utilisation de la plateforme Ultralytics offre une solution sans code pour entraîner, suivre et déployer ces modèles de pointe sans effort.

Contributeurs

Commentaires