Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 contre PP-YOLOE+#

Lorsque tu choisis un framework pour la détection d'objets en temps réel, tu évalues fréquemment diverses architectures haute performance en tant qu'ingénieur en apprentissage automatique. Deux modèles notables dans le paysage des applications industrielles sont YOLOv6-3.0 et PP-YOLOE+. Les deux modèles ont repoussé les limites de la précision et de la vitesse, tout en étant conçus pour des écosystèmes et du matériel de déploiement légèrement différents.

Cette comparaison technique offre un regard approfondi sur leurs architectures, leurs mesures de performance et leurs méthodologies d'entraînement, tout en présentant des alternatives modernes comme Ultralytics YOLO26 qui offrent une polyvalence et une facilité d'utilisation supérieures.

Link to this sectionYOLOv6-3.0 : Moteur industriel à haut débit#

Développé par le département Vision AI chez Meituan, YOLOv6-3.0 est fortement optimisé pour les environnements industriels, particulièrement ceux exploitant des GPU puissants de classe serveur.

  • Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
  • Organisation : Meituan
  • Date : 13-01-2023
  • Arxiv : 2301.05586
  • GitHub : meituan/YOLOv6

Link to this sectionInnovations architecturales#

YOLOv6-3.0 utilise une dorsale EfficientRep, spécifiquement conçue pour maximiser l'utilisation d'accélérateurs matériels comme les GPU NVIDIA. L'architecture introduit un module de Concaténation Bi-directionnelle (BiC) dans le cou, améliorant significativement la fusion de caractéristiques multi-échelles. De plus, il intègre une stratégie d'Entraînement Assisté par Ancre (AAT). Cette approche hybride bénéficie des caractéristiques de convergence robustes des réseaux basés sur des ancres pendant la phase d'entraînement, tout en éliminant les ancres pendant l'inférence pour maintenir la haute vitesse typique des paradigmes sans ancres.

En savoir plus sur YOLOv6

Link to this sectionPP-YOLOE+ : Le champion de la détection de PaddlePaddle#

PP-YOLOE+ est une évolution de la série PP-YOLO, développée entièrement au sein du framework PaddlePaddle par les chercheurs de Baidu. Il excelle dans les environnements où l'écosystème Paddle est déjà établi.

Link to this sectionInnovations architecturales#

PP-YOLOE+ est un détecteur sans ancres qui introduit une stratégie d'assignation dynamique des étiquettes connue sous le nom de TAL (Task Alignment Learning). Il utilise une dorsale CSPRepResNet, qui capture efficacement les caractéristiques sémantiques tout en maintenant l'efficacité computationnelle. Le modèle est hautement optimisé pour le déploiement via TensorRT et OpenVINO, ce qui en fait un candidat solide pour les déploiements en périphérie (edge) et sur serveur, à condition que tu sois à l'aise avec la navigation dans l'API PaddlePaddle.

En savoir plus sur PP-YOLOE+

Considérations sur le framework

Bien que PP-YOLOE+ offre d'excellents résultats, sa dépendance à PaddlePaddle peut présenter une courbe d'apprentissage pour les ingénieurs habitués à PyTorch. Utiliser un framework unifié comme Ultralytics peut réduire considérablement le temps de configuration.

Link to this sectionComparaison des performances#

L'évaluation de ces modèles nécessite d'examiner leur équilibre entre précision moyenne (mAP) et vitesse d'inférence. Le tableau ci-dessous souligne leurs performances sur le jeu de données de validation COCO.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037,5-1,174.711.4
YOLOv6-3.0s64045,0-2.6618,545,3
YOLOv6-3.0m64050,0-5,2834,985,8
YOLOv6-3.0l64052,8-8,9559,6150,7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Bien que les deux modèles affichent de solides performances, YOLOv6-3.0 conserve généralement un léger avantage en vitesse brute avec TensorRT sur les modèles de petite taille, ce qui le rend très efficace pour le paiement automatisé rapide ou la détection de défauts de fabrication. Inversement, PP-YOLOE+ s'adapte bien à des nombres de paramètres plus élevés pour une précision maximale.

Link to this sectionL'avantage Ultralytics : Présentation de YOLO26#

Bien que YOLOv6-3.0 et PP-YOLOE+ soient très performants, l'évolution rapide de la vision par ordinateur exige des architectures qui offrent non seulement une vitesse brute, mais aussi une facilité d'utilisation exceptionnelle, des besoins en mémoire plus faibles et un écosystème unifié. C'est là que les modèles Ultralytics YOLO, en particulier YOLO11 et le très moderne YOLO26, redéfinissent l'état de l'art.

Sorti en janvier 2026, YOLO26 établit une nouvelle référence pour l'IA visuelle axée sur la périphérie et prête pour le cloud, offrant des avantages significatifs sur les modèles hérités :

  • Conception de bout en bout sans NMS : En s'appuyant sur les fondations posées par YOLOv10, YOLO26 élimine nativement la Non-Maximum Suppression (NMS) lors du post-traitement. Cela simplifie considérablement la logique de déploiement et réduit la variabilité de la latence dans les scènes encombrées.
  • Inférence CPU jusqu'à 43 % plus rapide : En supprimant stratégiquement la Distribution Focal Loss (DFL), YOLO26 accélère radicalement les performances CPU, le rendant bien supérieur à YOLOv6 ou PP-YOLOE+ pour les appareils IoT et les applications mobiles.
  • Optimiseur MuSGD : Inspiré par des techniques avancées d'entraînement de LLM (comme le Kimi K2 de Moonshot AI), l'optimiseur hybride MuSGD offre un entraînement incroyablement stable et efficace, convergeant plus rapidement que le SGD traditionnel ou AdamW.
  • ProgLoss + STAL : Ces fonctions de perte avancées apportent des améliorations notables dans la reconnaissance de petits objets, un facteur critique pour l'imagerie par drone et la surveillance aérienne.
  • Polyvalence entre les tâches : Contrairement à YOLOv6-3.0 qui est fortement axé sur la détection, YOLO26 prend en charge la segmentation d'instance, l'estimation de pose, la classification et la détection par boîte englobante orientée (OBB) dès sa sortie.

Link to this sectionÉcosystème d'entraînement rationalisé#

Le déploiement de PP-YOLOE+ nécessite de gérer l'environnement PaddlePaddle, tandis que YOLOv6-3.0 nécessite de naviguer à travers des scripts axés sur la recherche. En revanche, la Plateforme Ultralytics offre une expérience fluide, de zéro à héros.

L'entraînement d'un modèle YOLO26 à la pointe de la technologie ne nécessite que quelques lignes de Python :

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

Cette API simple, combinée à une utilisation mémoire plus faible pendant l'entraînement par rapport aux modèles lourds en Transformers comme RT-DETR, démocratise l'IA haute performance.

Link to this sectionCas d'utilisation idéaux et stratégies de déploiement#

Le choix du bon modèle dicte le succès de ton pipeline de déploiement.

Link to this sectionQuand utiliser YOLOv6-3.0#

  • Fabrication à haute vitesse : Environnements où les caméras industrielles alimentent directement des GPU NVIDIA T4 ou A100 dédiés, nécessitant une inférence constante en moins de 5 ms.
  • Analytique vidéo côté serveur : Traitement de multiples flux vidéo denses où le débit GPU pur est le goulot d'étranglement principal.

Link to this sectionQuand utiliser PP-YOLOE+#

  • Écosystèmes Baidu/Paddle : Environnements d'entreprise fortement investis dans la pile technologique PaddlePaddle ou déployant spécifiquement sur du matériel optimisé pour la chaîne d'outils de Baidu.
  • Images statiques haute précision : Scénarios où la mAP élevée du modèle Extra-Large (PP-YOLOE+x) est plus critique que la vitesse de déploiement en périphérie.

Link to this sectionQuand choisir Ultralytics YOLO26#

  • Appareils Edge et IoT : Avec sa conception sans NMS et la suppression de DFL, YOLO26 est le choix incontesté pour les déploiements sur Raspberry Pi, NXP ou CPU mobiles.
  • Applications multi-tâches : Projets nécessitant simultanément le suivi d'objets, l'estimation de pose ou la segmentation en utilisant une API unifiée.
  • Du prototypage rapide à la production : Équipes tirant parti de la Plateforme Ultralytics pour une annotation de jeu de données rationalisée, le réglage d'hyperparamètres et le déploiement de modèle en un clic.

Pour les développeurs cherchant à explorer le vaste paysage des modèles de détection, des frameworks comme YOLOX et DAMO-YOLO offrent également des approches architecturales uniques méritant d'être examinées dans la documentation d'Ultralytics.

Contributeurs

Commentaires