Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 vs PP-YOLOE+#

Choisir l'architecture de réseau neuronal optimale est essentiel lors du déploiement d'applications de vision par ordinateur en production. Dans cette comparaison technique, nous examinons deux modèles de premier plan dans le domaine de la détection d'objets en temps réel : Ultralytics YOLO11 et PP-YOLOE+ de Baidu. Les deux architectures offrent des performances robustes, mais elles abordent très différemment les défis de la précision, de la vitesse d'inférence et de l'écosystème de développement.

Tu trouveras ci-dessous un graphique interactif présentant les limites de performance de ces modèles pour t'aider à identifier celui qui convient le mieux à tes contraintes matérielles.

Link to this sectionOrigines des modèles et lignée technique#

Comprendre les origines et les philosophies de conception de ces modèles fournit un contexte précieux sur leurs forces respectives et leurs cas d'utilisation idéaux.

Link to this sectionDétails de YOLO11#

Développé par Ultralytics, YOLO11 représente une itération hautement raffinée de la série YOLO, privilégiant un équilibre entre inférence haute vitesse, efficacité extrême des paramètres et une facilité d'utilisation inégalée. Il est largement reconnu pour ses capacités multi-tâches unifiées et son API Python conviviale pour les développeurs.

En savoir plus sur YOLO11

Link to this sectionDétails sur PP-YOLOE+#

PP-YOLOE+ est une version évoluée de PP-YOLOv2, construite sur le framework PaddlePaddle. Il introduit des changements architecturaux comme le backbone CSPRepResNet et l'apprentissage par alignement de tâches (TAL) pour repousser les limites de la précision, particulièrement sur les GPU haut de gamme.

En savoir plus sur PP-YOLOE+

Link to this sectionDifférences architecturales#

Les conceptions architecturales fondamentales de YOLO11 et PP-YOLOE+ reflètent leurs priorités divergentes dans le paysage de la vision par ordinateur.

YOLO11 s'appuie sur un backbone hautement optimisé et une tête de détection sans ancres (anchor-free). Il utilise des blocs C3k2 et le Spatial Pyramid Pooling - Fast (SPPF) pour capturer des caractéristiques multi-échelles avec un surcoût computationnel minimal. Cette conception est très avantageuse pour réduire la latence d'inférence sur les appareils aux ressources limitées comme les NPU edge et les CPU mobiles. De plus, YOLO11 est conçu nativement pour l'apprentissage multi-tâches, prenant en charge la segmentation d'instances, l'estimation de pose et la détection par boîte englobante orientée (OBB) dès la sortie de boîte.

PP-YOLOE+ introduit le backbone CSPRepResNet et une tête efficace alignée sur les tâches (ET-head). Il utilise intensivement des techniques de rep-parameterization pour augmenter la capacité de représentation pendant l'entraînement tout en fusionnant ces paramètres dans des convolutions standard pour l'inférence. Bien que cela donne une mAP (précision moyenne) impressionnante, les modèles résultants ont tendance à être plus lourds en termes de paramètres et d'empreinte mémoire, les rendant mieux adaptés à un déploiement sur des serveurs GPU robustes plutôt que sur des appareils edge légers.

Polyvalence multi-tâches

Si ton projet nécessite d'aller au-delà des boîtes englobantes standard, Ultralytics YOLO11 fournit un support natif pour la segmentation, l'estimation de pose et la classification au sein de la même API, réduisant considérablement la charge de travail de développement par rapport à l'intégration de plusieurs référentiels distincts.

Link to this sectionPerformances et benchmarks#

Lors de l'évaluation des performances, nous examinons la précision (mAP), la vitesse d'inférence sur différents matériels et l'efficacité du modèle (paramètres et FLOPs). Le tableau ci-dessous met en évidence les métriques comparatives, avec les valeurs les plus efficaces ou les plus performantes en gras.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811,356,9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionAnalyse#

YOLO11 démontre un avantage clair en équilibre de performance et en efficacité des paramètres. Par exemple, YOLO11m atteint une mAP plus élevée (51,5) que PP-YOLOE+m (49,8) tout en utilisant moins de paramètres (20,1M contre 23,43M) et en atteignant des vitesses d'inférence nettement plus rapides sur TensorRT (4,7ms contre 5,56ms). La nature légère des modèles YOLO11 se traduit intrinsèquement par des besoins en mémoire plus faibles pendant l'entraînement du modèle et son déploiement.

Link to this sectionÉcosystème d'entraînement et facilité d'utilisation#

La vraie valeur d'un modèle réside souvent dans la facilité avec laquelle les développeurs peuvent l'entraîner sur des jeux de données de vision par ordinateur personnalisés et le déployer en production.

Link to this sectionL'avantage Ultralytics#

Ultralytics privilégie une expérience de développement simplifiée. L'entraînement de YOLO11 est géré via une simple API Python ou CLI, en faisant abstraction du code répétitif complexe. La Plateforme Ultralytics améliore encore cela en proposant un entraînement sans code, une gestion automatisée des jeux de données et des exportations en un clic vers des formats tels que ONNX, CoreML et TensorRT.

De plus, les modèles YOLO sont très économes en mémoire pendant l'entraînement, évitant les surcharges massives de VRAM typiques des architectures basées sur les Transformers ou des modèles lourdement rep-parameterized, permettant ainsi un entraînement sur du matériel grand public.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Link to this sectionÉcosystème PP-YOLOE+#

PP-YOLOE+ fonctionne au sein de l'écosystème PaddleDetection. Bien que ce framework soit puissant et profondément intégré aux solutions industrielles de Baidu, il exige des développeurs qu'ils adoptent le framework d'apprentissage profond spécifique PaddlePaddle. Cela peut introduire une courbe d'apprentissage plus raide pour les équipes déjà standardisées sur PyTorch. De plus, l'exportation des modèles PP-YOLOE+ vers des formats universels standard pour les appareils edge peut nécessiter des étapes de conversion supplémentaires par rapport aux pipelines d'exportation natifs trouvés dans les flux de travail Ultralytics.

Link to this sectionCas d'utilisation idéaux#

Le choix entre ces modèles dépend de ton environnement de déploiement spécifique.

  • Choisis YOLO11 pour un développement agile, l'informatique en périphérie (edge computing) et les applications mobiles. Sa vitesse d'inférence élevée, sa faible empreinte mémoire et ses capacités d'exportation étendues le rendent idéal pour des tâches comme la gestion des stocks en magasin en temps réel sur des CPU standard, l'analyse d'imagerie aérienne par drone et les pipelines multi-tâches complexes.
  • Choisis PP-YOLOE+ si tout ton pipeline de production est déjà fortement investi dans l'écosystème PaddlePaddle ou si tu déploies sur des serveurs d'inférence haut de gamme dédiés où les contraintes de mémoire et la compatibilité matérielle (en dehors du matériel optimisé par Paddle) ne sont pas des préoccupations majeures.

Link to this sectionLa prochaine génération : Introduction de YOLO26#

Bien que YOLO11 reste incroyablement puissant, le domaine de l'IA évolue rapidement. Pour ce qui se fait de mieux en matière de détection d'objets, Ultralytics a introduit le nouveau YOLO26. Sorti en janvier 2026, YOLO26 s'appuie sur les succès de ses prédécesseurs pour offrir une efficacité et une précision sans précédent.

Innovations clés de YOLO26 :

  • Conception de bout en bout sans NMS : YOLO26 élimine nativement le post-traitement de Non-Maximum Suppression (NMS). Cela accélère considérablement l'inférence et simplifie la logique de déploiement, un saut architectural d'abord initié dans YOLOv10.
  • Inférence CPU jusqu'à 43 % plus rapide : Optimisé spécifiquement pour les appareils edge sans GPU, garantissant des performances en temps réel sur du matériel à faible consommation.
  • Optimiseur MuSGD : Inspiré par la stabilité de l'entraînement des LLM, cet hybride de SGD et Muon assure une convergence plus rapide et un entraînement plus stable.
  • ProgLoss + STAL : Des fonctions de perte améliorées augmentent radicalement la reconnaissance des petits objets, ce qui est crucial pour les applications de drones et la surveillance de sécurité.
  • Suppression de DFL : Le retrait de la Distribution Focal Loss simplifie l'exportation du modèle et améliore considérablement la compatibilité sur une large gamme d'appareils edge.

Pour les nouveaux projets privilégiant la vitesse, une exportation transparente et une précision maximale, nous recommandons fortement d'exploiter les capacités de YOLO26 via la Plateforme Ultralytics.

Si tu évalues d'autres architectures, tu pourrais également être intéressé par la comparaison de YOLO11 avec RT-DETR ou par l'exploration de la manière dont l'ancien YOLOv8 se comporte dans les benchmarks modernes.

Contributeurs

Commentaires