Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOv9#

Le paysage de la vision par ordinateur en temps réel change constamment, les chercheurs et les développeurs repoussant continuellement les limites de la précision et de la vitesse d'inférence. En comparant PP-YOLOE+ et YOLOv9, nous examinons deux philosophies distinctes en matière d'architecture de modèle et de conception d'écosystème.

Cette comparaison technique complète analyse leurs innovations architecturales, leurs métriques de performance, leurs méthodologies d'entraînement et leurs cas d'utilisation idéaux pour t'aider à choisir le bon modèle de détection d'objets pour ton prochain déploiement.

Link to this sectionLignage des modèles et fondements techniques#

Comprendre les origines et les choix architecturaux de ces modèles est crucial pour déterminer leur adéquation avec tes projets de vision par ordinateur.

Link to this sectionAperçu de PP-YOLOE+#

Développé par les auteurs de PaddlePaddle chez Baidu, PP-YOLOE+ a été introduit le 2 avril 2022. Il s'appuie sur les itérations précédentes au sein du framework PaddleDetection pour offrir une détection d'objets haute performance.

PP-YOLOE+ introduit une architecture robuste sans ancres (anchor-free), fortement optimisée pour un déploiement au sein de l'écosystème PaddlePaddle. Il utilise une backbone CSPRepResNet modifiée et une tête ET-head pour améliorer l'extraction de caractéristiques et la régression des boîtes englobantes. Bien qu'il atteigne une précision moyenne (mAP) élevée, sa dépendance vis-à-vis du framework PaddlePaddle peut parfois introduire des frictions d'intégration pour les développeurs habitués à PyTorch ou TensorFlow.

En savoir plus sur PP-YOLOE+

Link to this sectionPrésentation de YOLOv9#

Introduit par Chien-Yao Wang et Hong-Yuan Mark Liao de l'Institut des sciences de l'information, Academia Sinica, Taïwan, YOLOv9 marque un bond significatif dans la gestion efficace des goulots d'étranglement de l'information dans l'apprentissage profond (deep learning).

  • Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica, Taïwan
  • Date : 2024-02-21
  • Arxiv : 2402.13616
  • GitHub : WongKinYiu/yolov9

La percée majeure de YOLOv9 est l'information de gradient programmable (PGI), qui empêche la perte de données à mesure que les caractéristiques traversent les réseaux neuronaux profonds. Combiné au réseau d'agrégation de couches efficace généralisé (GELAN), YOLOv9 maximise l'efficacité des paramètres et le flux computationnel. De plus, il est intégré nativement dans l'écosystème Ultralytics, ce qui le rend très accessible tant pour la recherche que pour les applications commerciales.

En savoir plus sur YOLOv9

Autres modèles Ultralytics

Si tu explores des options à la pointe de la technologie, tu pourrais également t'intéresser à YOLO11 et RT-DETR, qui offrent des équilibres variés entre précision basée sur les Transformers et performance en temps réel à la périphérie (edge).

Link to this sectionComparaison des performances et des mesures#

Lors de l'analyse des performances brutes, YOLOv9 démontre une efficacité exceptionnelle des paramètres. Il atteint une précision comparable ou supérieure tout en nécessitant moins de paramètres et de FLOPs, ce qui se traduit par des besoins en VRAM plus faibles pendant l'entraînement du modèle.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Comme on peut le voir dans le tableau, YOLOv9c atteint un solide 53.0 mAP avec nettement moins de paramètres (25,3 M) que le PP-YOLOE+l comparable (52,2 M). Cette utilisation réduite de la mémoire fait de YOLOv9 un choix supérieur pour les développeurs travaillant avec des ressources GPU limitées.

Link to this sectionÉcosystème, polyvalence et facilité d'utilisation#

L'avantage déterminant de YOLOv9 réside dans son intégration transparente avec l'écosystème Ultralytics, qui est bien entretenu. Alors que PP-YOLOE+ nécessite de naviguer dans des fichiers de configuration complexes de PaddlePaddle, YOLOv9 bénéficie d'une API Python simplifiée.

L'API Python Ultralytics permet aux développeurs de charger des poids pré-entraînés, de gérer l'augmentation des données et de lancer l'entraînement avec un minimum de code répétitif (boilerplate code).

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

De plus, l'écosystème Ultralytics offre une polyvalence inégalée. Au-delà de la détection par boîtes englobantes, le framework prend nativement en charge la segmentation d'instances, l'estimation de pose et la détection par boîte englobante orientée (OBB). Cela rend l'adaptation de ton modèle à des pipelines complexes du monde réel incroyablement efficace.

Options d'exportation

Les modèles entraînés en utilisant le framework Ultralytics peuvent être exportés dans plusieurs formats, incluant TensorRT et OpenVINO, assurant une inférence hautement optimisée sur du matériel divers.

Link to this sectionCas d'utilisation et recommandations#

Le choix entre PP-YOLOE+ et YOLOv9 dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir PP-YOLOE+#

PP-YOLOE+ est un choix solide pour :

  • Intégration à l'écosystème PaddlePaddle : Organisations disposant d'infrastructures existantes basées sur le framework et les outils de PaddlePaddle de Baidu.
  • Déploiement Edge sur Paddle Lite : Déploiement sur du matériel doté de noyaux d'inférence hautement optimisés spécifiquement pour le moteur Paddle Lite ou le moteur d'inférence Paddle.
  • Détection côté serveur haute précision : Scénarios privilégiant une précision de détection maximale sur des serveurs GPU puissants où la dépendance au framework n'est pas un problème.

Link to this sectionQuand choisir YOLOv9#

YOLOv9 est recommandé pour :

  • Recherche sur le goulot d'étranglement de l'information : Projets académiques étudiant les architectures Programmable Gradient Information (PGI) et Generalized Efficient Layer Aggregation Network (GELAN).
  • Études sur l'optimisation du flux de gradient : Recherche axée sur la compréhension et l'atténuation de la perte d'informations dans les couches profondes du réseau pendant l'entraînement.
  • Benchmarks de détection haute précision : Scénarios où les performances solides de YOLOv9 sur le benchmark COCO sont nécessaires comme point de référence pour les comparaisons architecturales.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionRegarder vers l'avenir : l'avantage de YOLO26#

Bien que PP-YOLOE+ et YOLOv9 soient tous deux puissants, le nouveau YOLO26 représente la prochaine étape définitive pour les environnements de production. Lancé en janvier 2026, YOLO26 établit une nouvelle norme pour l'Edge Computing et les déploiements cloud. Nous recommandons vivement YOLO26 pour tous les nouveaux projets de vision par ordinateur en raison de ses innovations révolutionnaires :

  • Conception de bout en bout sans NMS : YOLO26 est nativement de bout en bout, éliminant entièrement le besoin de post-traitement Non-Maximum Suppression (NMS). Cela simplifie considérablement les pipelines de déploiement et réduit la latence.
  • Inférence CPU jusqu'à 43 % plus rapide : En optimisant spécifiquement l'architecture pour l'Edge Computing, YOLO26 est nettement plus rapide sur du matériel dépourvu de GPU dédiés.
  • Suppression de DFL : La Distribution Focal Loss a été supprimée, rendant les exportations plus simples et améliorant radicalement la compatibilité avec les appareils edge à faible consommation.
  • Optimiseur MuSGD : Inspiré par les techniques d'entraînement de grands modèles de langage (comme Kimi K2 de Moonshot AI), cet hybride de SGD et Muon assure des dynamiques d'entraînement très stables et une convergence rapide.
  • ProgLoss + STAL : Ces fonctions de perte avancées apportent des améliorations notables dans la reconnaissance de petits objets, une mise à niveau essentielle pour l'imagerie aérienne et la robotique.
  • Améliorations spécifiques aux tâches : YOLO26 inclut des architectures personnalisées pour des tâches spécifiques, telles que le proto multi-échelle pour la segmentation et l'estimation de log-vraisemblance résiduelle (RLE) pour l'estimation de pose.

Tu peux facilement entraîner et déployer des modèles YOLO26 via la plateforme Ultralytics, une solution tout-en-un pour l'annotation de jeux de données, l'entraînement dans le cloud et la surveillance des modèles.

Link to this sectionApplications concrètes#

Choisir entre ces architectures revient souvent à considérer ton environnement de déploiement cible.

PP-YOLOE+ est fréquemment déployé dans les centres de fabrication industrielle, en particulier dans les régions où l'intégration PaddlePaddle et la pile matérielle de Baidu sont profondément ancrées dans l'infrastructure d'entreprise. Il excelle dans l'analyse d'images statiques où la précision absolue est privilégiée par rapport aux contraintes strictes de temps réel.

YOLOv9 excelle dans les environnements dynamiques nécessitant une inférence en temps réel rapide. Son efficacité supérieure en matière de paramètres le rend idéal pour la navigation autonome de drones et les systèmes de sécurité basés sur la périphérie. De plus, sa consommation réduite de VRAM abaisse la barrière à l'entrée pour les chercheurs s'entraînant sur des GPU grand public.

Pour la meilleure performance absolue dans la gestion du trafic des villes intelligentes et la robotique à haute vitesse, le nouveau YOLO26 est inégalé, offrant une efficacité de bout en bout sans le surcoût des goulots d'étranglement NMS.

Contributeurs

Commentaires