Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs PP-YOLOE+#

Le paysage de la détection d'objets en temps réel continue de progresser rapidement, offrant aux ingénieurs en vision par ordinateur un large éventail de choix pour déployer des modèles très précis sur des infrastructures edge et cloud. Deux modèles importants dans ce domaine sont YOLOv9 et PP-YOLOE+. Bien que les deux repoussent les limites de la précision et de la vitesse, ils sont issus de lignées de recherche et d'écosystèmes logiciels différents.

Cette comparaison technique complète explore leurs architectures, leurs méthodologies d'entraînement, leurs mesures de performance et leurs applications réelles idéales. Nous explorerons également comment le l'écosystème Ultralytics plus large offre des avantages significatifs aux développeurs privilégiant la facilité d'utilisation, l'efficacité mémoire et le déploiement polyvalent.

Link to this sectionOrigines des modèles et spécifications techniques#

Comprendre l'historique de ces modèles aide à contextualiser leurs décisions architecturales et leurs dépendances aux frameworks.

Link to this sectionYOLOv9 : Résoudre le goulot d'étranglement de l'information#

Introduit début 2024, YOLOv9 traite la perte de données qui survient lorsque les informations circulent à travers les réseaux neuronaux profonds. Il s'agit d'un réseau neuronal convolutif hautement optimisé conçu pour maximiser l'efficacité des paramètres.

En savoir plus sur YOLOv9

Link to this sectionPP-YOLOE+ : Faire progresser l'écosystème Paddle#

Publié par Baidu en 2022, PP-YOLOE+ est une amélioration itérative de PP-YOLOv2. Il utilise un paradigme sans ancrage (anchor-free) et introduit une stratégie d'assignation d'étiquettes dynamique pour améliorer la convergence et la précision au sein du framework PaddlePaddle.

En savoir plus sur PP-YOLOE+

Link to this sectionComparaison architecturale#

Link to this sectionProgrammable Gradient Information vs. CSPRepResStage#

L'innovation majeure de YOLOv9 est la Programmable Gradient Information (PGI). La PGI agit comme un cadre de supervision auxiliaire, garantissant que les informations de gradient vitales sont préservées et propagées avec précision vers les couches superficielles pendant l'entraînement. Cela est associé au Generalized Efficient Layer Aggregation Network (GELAN), qui combine les forces de CSPNet et d'ELAN pour offrir une grande précision tout en réduisant considérablement le coût computationnel (FLOPs).

PP-YOLOE+ s'appuie sur une structure dorsale spécialisée appelée CSPRepResStage. Il exploite des techniques de re-paramétrage (similaires à celles observées dans RepVGG) pour accélérer l'inférence en fusionnant les couches de convolution lors du déploiement. De plus, il utilise l'Efficient Task-aligned head (ET-head) pour équilibrer les tâches de classification et de régression.

Bien que PP-YOLOE+ soit robuste, l'architecture GELAN de YOLOv9 nécessite généralement une empreinte mémoire plus faible pendant l'entraînement et l'inférence, ce qui le rend exceptionnellement bien adapté aux appareils d'IA en périphérie.

Link to this sectionComparaison des performances#

Lors de l'évaluation de modèles pour la production, le compromis entre mAP (mean Average Precision), vitesse d'inférence et taille du modèle est crucial.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320,076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionAnalyse#

  • Efficacité des paramètres : YOLOv9 atteint une efficacité remarquablement plus élevée. Par exemple, YOLOv9c atteint une mAP de 53,0 % en utilisant seulement 25,3 M de paramètres, tandis que PP-YOLOE+l nécessite plus du double de paramètres (52,2 M) pour atteindre une mAP légèrement inférieure de 52,9 %. Cela réduit considérablement les besoins en mémoire pour YOLOv9.
  • Vitesse d'inférence : Les modèles YOLOv9 démontrent une excellente optimisation pour les accélérateurs matériels comme TensorRT, offrant des vitesses d'inférence compétitives sur les GPU NVIDIA T4, cruciales pour l'inférence en temps réel.

Link to this sectionMéthodologies d'entraînement et Écosystème#

Le choix entre ces modèles dépend souvent de l'écosystème logiciel.

Link to this sectionPP-YOLOE+ et PaddlePaddle#

PP-YOLOE+ est étroitement couplé à la suite PaddleDetection. Bien que puissant, il oblige les utilisateurs à naviguer dans un environnement complexe, axé sur la ligne de commande et nécessitant beaucoup de configuration. Pour les équipes profondément ancrées dans les écosystèmes PyTorch ou TensorFlow, la transition vers PaddlePaddle introduit une friction significative et une courbe d'apprentissage plus raide.

Link to this sectionL'avantage Ultralytics : Flux de travail simplifiés#

En revanche, YOLOv9 fonctionne au sein de l'écosystème Ultralytics hautement peaufiné. Conçu pour les développeurs et les chercheurs, Ultralytics privilégie une facilité d'utilisation exceptionnelle. L'API Python abstrait complètement le code répétitif et complexe.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
model.export(format="onnx")

Ce flux de travail met en évidence l'Efficacité d'Entraînement supérieure des modèles Ultralytics. La prise en charge native de l'augmentation de données, de l'entraînement distribué et de la journalisation automatique vers des plateformes comme Weights & Biases ou MLflow est standard.

Découvre les dernières nouveautés en Vision IA

Bien que YOLOv9 offre des performances exceptionnelles, nous recommandons fortement de considérer le tout nouveau Ultralytics YOLO26 pour les nouveaux projets. YOLO26 présente une conception native sans NMS de bout en bout, simplifiant considérablement le déploiement. Avec la suppression de DFL (Distribution Focal Loss supprimée pour une exportation simplifiée et une meilleure compatibilité avec les appareils edge/basse consommation), il offre jusqu'à 43 % d'inférence CPU plus rapide pour l'informatique en périphérie. Propulsé par l'optimiseur MuSGD, il assure un entraînement stable et une convergence rapide. De plus, ProgLoss + STAL fournit des fonctions de perte améliorées avec des avancées notables dans la reconnaissance des petits objets, critique pour l'IoT, la robotique et l'imagerie aérienne.

Link to this sectionPolyvalence et prise en charge des tâches#

Les projets modernes de vision par ordinateur se limitent rarement à de simples boîtes englobantes.

PP-YOLOE+ est principalement conçu pour la détection d'objets standard. L'adaptation de son architecture à d'autres tâches implique une ingénierie personnalisée approfondie.

Conversely, the Ultralytics framework is a multi-task powerhouse. By utilizing a unified API, developers can effortlessly switch from standard object detection to complex Instance Segmentation, highly accurate Pose Estimation, Oriented Bounding Box (OBB) detection for aerial imagery, and Image Classification. This unparalleled versatility is why enterprise teams consistently choose Ultralytics models like YOLOv9, YOLO11, and YOLO26.

Link to this sectionCas d'utilisation et applications idéaux#

  • Analyses Smart City et gestion du trafic : La grande efficacité des paramètres et la faible latence de YOLOv9 (et du YOLO26 ultérieur) les rendent idéaux pour un déploiement sur du matériel edge contraint (comme les appareils NVIDIA Jetson) afin de surveiller le flux de trafic et la sécurité urbaine.
  • Systèmes d'inventaire de vente au détail : Pour détecter des configurations denses de petits articles sur des étagères, la PGI de YOLOv9 maintient efficacement les détails spatiaux fins, surpassant PP-YOLOE+ sur les tâches de détection de petits objets.
  • Déploiements hérités : PP-YOLOE+ reste une option viable strictement pour les équipes expressément mandatées pour utiliser la pile logicielle Baidu/PaddlePaddle dans une infrastructure existante.

Pour les chercheurs explorant des architectures basées sur les Transformers, Ultralytics prend également en charge nativement RT-DETR au sein de la même API facile à utiliser, garantissant que tu as toujours accès au modèle optimal pour tes besoins de déploiement spécifiques.

Commentaires