Passer au contenu

YOLOv6.0 vs PP-YOLOE+ : évaluation des détecteurs d'objets industriels

Lorsqu'ils choisissent un cadre pour la détection d'objets en temps réel, les ingénieurs en apprentissage automatique évaluent souvent diverses architectures hautement performantes. Deux modèles notables dans le domaine des applications industrielles sont YOLOv6.YOLOv6 et PP-YOLOE+. Ces deux modèles ont repoussé les limites de la précision et de la vitesse, mais ils sont adaptés à des écosystèmes et à du matériel de déploiement légèrement différents.

Cette comparaison technique fournit un aperçu détaillé de leurs architectures, de leurs indicateurs de performance et de leurs méthodologies de formation, tout en présentant des alternatives modernes telles que Ultralytics , qui offrent une polyvalence et une facilité d'utilisation supérieures.

YOLOv6.0 : moteur industriel à haut débit

Développé par le département Vision AI de Meituan, YOLOv6. YOLOv6 est fortement optimisé pour les environnements industriels, en particulier ceux qui exploitent de puissants GPU de niveau serveur.

  • Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
  • Organisation : Meituan
  • Date : 13 janvier 2023
  • Arxiv : 2301.05586
  • GitHub : YOLOv6

Innovations architecturales

YOLOv6.0 utilise une structure EfficientRep, spécialement conçue pour optimiser l'utilisation des accélérateurs matériels tels que NVIDIA L'architecture introduit un module de concaténation bidirectionnelle (BiC) dans le cou, améliorant considérablement la fusion des fonctionnalités multi-échelles. De plus, elle intègre une stratégie d'apprentissage assisté par ancrage (AAT). Cette approche hybride bénéficie des caractéristiques de convergence robustes des réseaux basés sur des ancrages pendant la phase d'apprentissage, tout en supprimant les ancrages pendant l'inférence afin de conserver la vitesse élevée typique des paradigmes sans ancrage.

En savoir plus sur YOLOv6

PP-YOLOE+ : le champion de la détection PaddlePaddle

PP-YOLOE+ est une évolution de laYOLO , entièrement développée dans le PaddlePaddle par les chercheurs de Baidu. Il excelle dans les environnements où l'écosystème Paddle est déjà établi.

Innovations architecturales

PP-YOLOE+ est un détecteur sans ancrage qui introduit une stratégie d'attribution dynamique d'étiquettes connue sous le nom de TAL (Task Alignment Learning). Il utilise une structure CSPRepResNet, qui capture efficacement les caractéristiques sémantiques tout en conservant une efficacité computationnelle. Le modèle est hautement optimisé pour un déploiement via TensorRT OpenVINO, ce qui en fait un candidat sérieux pour les déploiements en périphérie et sur serveur, à condition que l'utilisateur soit à l'aise avec PaddlePaddle .

En savoir plus sur PP-YOLOE+

Considérations relatives au cadre

Bien que PP-YOLOE+ offre d'excellents résultats, son utilisation de PaddlePaddle représenter une courbe d'apprentissage pour les ingénieurs habitués à PyTorch. L'utilisation d'un cadre unifié tel que Ultralytics peut réduire considérablement le temps de configuration.

Comparaison des performances

Pour évaluer ces modèles, il faut examiner leur équilibre entre la précision moyenne (mAP) et la vitesse d'inférence. Le tableau ci-dessous met en évidence leurs performances sur l'ensemble de données COCO .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Bien que les deux modèles affichent d'excellentes performances, YOLOv6. YOLOv6 conserve généralement un léger avantage en termes de TensorRT brute TensorRT pour les modèles de petite taille, ce qui le rend très efficace pour les caisses automatiques à grande vitesse ou la détection des défauts de fabrication. À l'inverse, PP-YOLOE+ s'adapte bien aux paramètres plus importants pour une précision maximale.

Ultralytics : présentation de YOLO26

Bien que YOLOv6. YOLOv6 et PP-YOLOE+ soient très performants, l'évolution rapide de la vision par ordinateur exige des architectures qui offrent non seulement une vitesse brute, mais aussi une facilité d'utilisation exceptionnelle, des besoins en mémoire réduits et un écosystème unifié. C'est là qu'intervient Ultralytics YOLO , en particulier YOLO11 et le très avancé YOLO26, redéfinissent l'état de l'art.

Sorti en janvier 2026, YOLO26 établit une nouvelle référence en matière d'IA visuelle edge-first et cloud-ready, offrant des avantages significatifs par rapport aux modèles existants :

  • Conception NMS de bout en bout : s'appuyant sur les bases posées par YOLOv10, YOLO26 élimine de manière native la suppression non maximale (NMS) pendant le post-traitement. Cela simplifie considérablement la logique de déploiement et réduit la variabilité de la latence dans les scènes encombrées.
  • CPU jusqu'à 43 % plus rapide : en supprimant stratégiquement la perte focale de distribution (DFL), YOLO26 accélère considérablement CPU , ce qui le rend largement supérieur à YOLOv6 PP-YOLOE+ pour les appareils IoT et les applications mobiles.
  • Optimiseur MuSGD : inspiré des techniques avancées d'entraînement LLM (comme Kimi K2 de Moonshot AI), l'optimiseur hybride MuSGD offre un entraînement incroyablement stable et efficace, convergeant plus rapidement que SGD traditionnelles SGD AdamW.
  • ProgLoss + STAL : ces fonctions de perte avancées apportent des améliorations notables dans la reconnaissance des petits objets, un facteur essentiel pour l'imagerie par drone et la surveillance aérienne.
  • Polyvalence dans toutes les tâches : contrairement à YOLOv6. YOLOv6, qui est fortement axé sur la détection, YOLO26 prend en charge la segmentation d'instances, l'estimation de pose, la classification et la détection de boîtes englobantes orientées (OBB) dès son installation.

Écosystème de formation rationalisé

Le déploiement de PP-YOLOE+ nécessite la gestion de PaddlePaddle , tandis que YOLOv6. YOLOv6 nécessite la navigation dans des scripts axés sur la recherche. En revanche, la Ultralytics offre une expérience fluide, sans aucune difficulté.

La formation d'un modèle YOLO26 à la pointe de la technologie ne nécessite que quelques lignes de Python:

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

Cette API simple, combinée à une utilisation moindre de la mémoire pendant l'entraînement par rapport aux modèles lourds en transformateurs tels que RT-DETR, démocratise l'IA haute performance.

Cas d'utilisation idéaux et stratégies de déploiement

Le choix du bon modèle conditionne la réussite de votre pipeline de déploiement.

Quand utiliser YOLOv6.0

  • Fabrication à grande vitesse : environnements dans lesquels des caméras industrielles transmettent directement leurs données à des GPU NVIDIA ou A100 dédiés, nécessitant une inférence constante inférieure à 5 ms.
  • Analyse vidéo côté serveur : traitement de plusieurs flux vidéo denses où GPU pur GPU constitue le principal goulot d'étranglement.

Quand utiliser PP-YOLOE+

  • Écosystèmes Baidu/Paddle : environnements d'entreprise ayant investi massivement dans la pile PaddlePaddle ou déployant spécifiquement sur du matériel optimisé pour la chaîne d'outils Baidu.
  • Images statiques haute précision : scénarios dans lesquels mAP élevé du modèle Extra-Large (PP-YOLOE+x) mAP plus important que la vitesse de déploiement en périphérie.

Quand choisir Ultralytics

  • Périphériques Edge et IoT : grâce à sa conception NMS et à la suppression du DFL, YOLO26 est le choix incontestable pour les déploiements sur Raspberry Pi, NXP ou les processeurs mobiles.
  • Applications multitâches : projets nécessitant le suivi simultané d'objets, l'estimation de poses ou la segmentation à l'aide d'une API unifiée.
  • Du prototypage rapide à la production : les équipes exploitent la Ultralytics pour rationaliser l'annotation des ensembles de données, le réglage des hyperparamètres et le déploiement des modèles en un seul clic.

Pour les développeurs qui souhaitent explorer le paysage plus large des modèles de détection, des frameworks tels que YOLOX et YOLO proposent également des approches architecturales uniques qui méritent d'être examinées dans la Ultralytics .


Commentaires