Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOv6-3.0#

Le domaine de la vision par ordinateur en temps réel s'est rapidement développé, menant à des architectures hautement spécialisées et optimisées pour divers scénarios de déploiement. Les développeurs comparent fréquemment PP-YOLOE+ et YOLOv6-3.0 lorsqu'ils construisent des applications nécessitant un équilibre entre un débit élevé et une précision fiable. Les deux modèles ont apporté des améliorations architecturales substantielles dès leur sortie, en se concentrant sur l'amélioration des vitesses d'inférence pour les applications industrielles et en périphérie (edge).

Avant de plonger dans les détails architecturaux, explore le graphique ci-dessous pour visualiser les performances relatives de ces modèles en termes de vitesse et de précision.

Link to this sectionPP-YOLOE+ : Forces et faiblesses architecturales#

Développé par les auteurs de PaddlePaddle, PP-YOLOE+ est un détecteur sans ancres majeur qui s'appuie sur ses prédécesseurs pour offrir des performances robustes selon diverses exigences d'échelle.

Link to this sectionPoints forts de l'architecture#

PP-YOLOE+ a introduit plusieurs améliorations critiques par rapport à la conception originale de PP-YOLOE. Il tire parti d'un puissant backbone CSPRepResNet, qui équilibre efficacement le coût computationnel avec les capacités d'extraction de caractéristiques. De plus, il intègre un réseau de pyramide de caractéristiques (FPN) avancé combiné à un réseau d'agrégation de chemins (PAN) pour assurer la fusion de caractéristiques multi-échelles. L'une de ses fonctionnalités phares est l'ET-head (Efficient Task-aligned head), qui améliore considérablement la coordination de la classification et de la localisation lors de la détection d'objets.

Bien que PP-YOLOE+ atteigne une précision moyenne (mAP) impressionnante, sa dépendance à l'écosystème PaddlePaddle peut parfois présenter une courbe d'apprentissage abrupte pour les chercheurs habitués aux flux de travail natifs PyTorch. Cela peut légèrement compliquer le processus de déploiement de modèle lorsque tu cibles des appareils en périphérie hétérogènes qui manquent de support direct pour l'inférence Paddle.

Contexte de déploiement

PP-YOLOE+ est hautement optimisé pour un déploiement au sein de la pile technologique de Baidu, ce qui en fait un excellent choix si ton environnement de production repose fortement sur les outils d'inférence Paddle.

En savoir plus sur PP-YOLOE+

Link to this sectionYOLOv6-3.0 : Débit industriel#

Publié par le département Vision AI de Meituan, YOLOv6-3.0 a été explicitement conçu pour servir de détecteur d'objets de nouvelle génération pour les applications industrielles, en donnant la priorité à un débit massif sur le matériel GPU.

Link to this sectionPoints forts de l'architecture#

YOLOv6-3.0 dispose d'un backbone EfficientRep spécialement conçu pour maximiser l'utilisation du matériel, en particulier sur les GPU NVIDIA utilisant TensorRT. La mise à jour v3.0 a apporté un module de concaténation bidirectionnelle (BiC) au niveau du neck, améliorant la rétention des caractéristiques spatiales sans alourdir sévèrement le nombre de paramètres. De plus, il a introduit une stratégie d'entraînement assisté par ancres (AAT) qui fusionne les avantages de la stabilité basée sur les ancres pendant l'entraînement du modèle tout en maintenant une architecture rapide et sans ancres lors de l'inférence en temps réel.

Cependant, parce que YOLOv6-3.0 est hautement optimisé pour les GPU de niveau serveur, ses gains en latence diminuent parfois lorsqu'il est déployé sur des appareils en périphérie limités, uniquement basés sur CPU. Cette spécialisation signifie qu'il excelle dans des environnements comme l'analyse vidéo hors ligne, mais peut être à la traîne par rapport à des modèles optimisés dynamiquement sur du matériel plus petit et localisé.

En savoir plus sur YOLOv6

Link to this sectionTableau de comparaison des performances#

Le tableau suivant met en évidence les métriques de performance clés, en comparant directement les différentes variantes d'échelle des deux architectures.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037,5-1,174.711.4
YOLOv6-3.0s64045,0-2.6618,545,3
YOLOv6-3.0m64050,0-5,2834,985,8
YOLOv6-3.0l64052,8-8,9559,6150,7

Link to this sectionCas d'utilisation et recommandations#

Le choix entre PP-YOLOE+ et YOLOv6 dépend des exigences spécifiques de ton projet, des contraintes de déploiement et de tes préférences en matière d'écosystème.

Link to this sectionQuand choisir PP-YOLOE+#

PP-YOLOE+ est un choix solide pour :

  • Intégration à l'écosystème PaddlePaddle : Organisations disposant d'infrastructures existantes basées sur le framework et les outils de PaddlePaddle de Baidu.
  • Déploiement Edge sur Paddle Lite : Déploiement sur du matériel doté de noyaux d'inférence hautement optimisés spécifiquement pour le moteur Paddle Lite ou le moteur d'inférence Paddle.
  • Détection côté serveur haute précision : Scénarios privilégiant une précision de détection maximale sur des serveurs GPU puissants où la dépendance au framework n'est pas un problème.

Link to this sectionQuand choisir YOLOv6#

YOLOv6 est recommandé pour :

  • Déploiement industriel conscient du matériel : Les scénarios où la conception du modèle axée sur le matériel et la reparamétrisation efficace offrent des performances optimisées sur un matériel cible spécifique.
  • Détection rapide en une étape : Les applications priorisant la vitesse d'inférence brute sur GPU pour le traitement vidéo en temps réel dans des environnements contrôlés.
  • Intégration à l'écosystème Meituan : Les équipes travaillant déjà au sein de la pile technologique et de l'infrastructure de déploiement de Meituan.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionL'avantage Ultralytics : Aller au-delà des modèles hérités#

Bien que PP-YOLOE+ et YOLOv6-3.0 offrent des solutions ciblées, le développement IA moderne nécessite des flux de travail polyvalents et économes en mémoire. C'est là que la plateforme Ultralytics offre une expérience développeur inégalée. Avec une API Python unifiée, tu peux entraîner, valider et déployer sans effort des modèles de pointe sans la surcharge de configuration immense généralement rencontrée dans les anciens référentiels de recherche.

Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.

Link to this sectionDécouvre YOLO26 : Le nouveau standard#

Pour les organisations cherchant à déployer les modèles de vision les plus avancés, Ultralytics YOLO26 (publié en janvier 2026) redéfinit les limites de performance. Il surpasse significativement les anciennes générations grâce à plusieurs innovations critiques :

  • End-to-End NMS-Free Design: Building on concepts from YOLOv10, YOLO26 completely eliminates Non-Maximum Suppression (NMS) post-processing. This natively end-to-end approach guarantees predictable, ultra-low latency inference, crucial for real-time safety systems.
  • Inférence CPU jusqu'à 43 % plus rapide : Grâce à la suppression de la perte focale de distribution (DFL) de l'architecture, YOLO26 est radicalement optimisé pour l'informatique en périphérie et les environnements dépourvus d'accélération GPU dédiée.
  • Optimiseur MuSGD : Intégrant la stabilité de l'entraînement LLM dans les modèles de vision, cet optimiseur hybride (inspiré par Moonshot AI) permet une convergence rapide et des sessions d'entraînement personnalisé hautement stables.
  • ProgLoss + STAL : Ces formulations de perte avancées offrent des améliorations remarquables dans la reconnaissance d'objets de petite taille, essentielles pour des applications comme l'imagerie par drone aérien et l'analyse de scènes encombrées.
Pérennise tes pipelines

Si tu construis un nouveau projet aujourd'hui, nous recommandons fortement de contourner les architectures héritées et d'adopter YOLO26. Son efficacité mémoire et sa vitesse sans NMS le rendent beaucoup plus facile à mettre en production.

Link to this sectionImplémentation fluide#

L'entraînement et l'exportation de modèles de pointe en utilisant le package Python Ultralytics sont remarquablement simples. L'exemple suivant démontre comment entraîner le dernier modèle YOLO26 et l'exporter vers ONNX pour un déploiement rapide en périphérie :

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Pour les équipes profondément intégrées dans des flux de travail plus anciens mais recherchant une stabilité moderne, explorer Ultralytics YOLO11 est également une excellente étape de transition, offrant une polyvalence de tâches complète soutenue par l'écosystème complet Ultralytics.

Contributeurs

Commentaires