Passer au contenu

PP-YOLOE+ vs YOLO26 : détection d'objets à la pointe de la technologie

Dans le domaine en constante évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de détection d'objets afin d'équilibrer précision, rapidité et facilité de déploiement. Cette comparaison explore PP-YOLOE+, une version améliorée de PP-YOLOE de PaddlePaddle, et YOLO26, la dernière avancée révolutionnaire optimisée pour la périphérie Ultralytics. Ces deux modèles représentent des étapes importantes dans la détection en temps réel, mais ils répondent à des écosystèmes et à des besoins de déploiement différents.

Comparaison des performances visuelles

Le graphique suivant illustre les compromis en termes de performances entre PP-YOLOE+ et YOLO26, en soulignant les progrès réalisés en matière de latence et de précision grâce à la nouvelle architecture.

Aperçu du modèle

PP-YOLOE+

PP-YOLOE+ est une version améliorée de PP-YOLOE, développée par PaddlePaddle de Baidu. Elle s'appuie sur le paradigme sans ancrage et introduit une architecture unifiée cloud-edge qui fonctionne bien sur diverses plateformes matérielles. Elle se concentre sur l'optimisation du compromis entre précision et vitesse d'inférence, en particulier au sein de PaddlePaddle .

En savoir plus sur PP-YOLOE+

YOLO26

YOLO26 est la dernière version de la YOLO Ultralytics, conçue pour redéfinir l'efficacité de l'informatique de pointe. Lancée en janvier 2026, elle introduit une architecture native de bout en bout NMS, supprimant ainsi le besoin d'un post-traitement par suppression non maximale. Grâce à des optimisations majeures telles que la suppression de la perte focale de distribution (DFL) et l'introduction de l'optimiseur MuSGD, YOLO26 est spécialement conçu pour l'inférence à grande vitesse sur les processeurs et les appareils à faible consommation d'énergie.

En savoir plus sur YOLO26

Architecture technique et innovation

Les différences architecturales entre ces deux modèles déterminent leur adéquation à des tâches spécifiques.

Architecture de PP-YOLOE+

PP-YOLOE+ utilise une structure CSPRepResNet et un réseau pyramidal de caractéristiques (FPN) avec un réseau d'agrégation de chemins (PAN) pour la fusion de caractéristiques à plusieurs échelles. Les principales innovations sont les suivantes :

  • Conception sans ancrage : élimine le réglage des hyperparamètres de la boîte d'ancrage, simplifiant ainsi le processus d'apprentissage.
  • Apprentissage par alignement des tâches (TAL) : aligne explicitement les tâches de classification et de localisation, améliorant ainsi la qualité de la sélection des échantillons positifs.
  • ET-Head : une tête efficace alignée sur les tâches qui réduit la charge de calcul tout en conservant la précision.

Cependant, PP-YOLOE+ repose sur NMS traditionnel, qui peut introduire une variabilité de latence en fonction du nombre d'objets détectés dans une scène.

YOLO26 Innovation

YOLO26 représente un changement de paradigme vers la détection de bout en bout.

  • ConceptionNMS: en générant strictement une seule prédiction par objet, YOLO26 supprime complètement NMS . Ceci est essentiel pour le déploiement sur des appareils périphériques où la logique de post-traitement peut constituer un goulot d'étranglement.
  • MuSGD Optimizer : inspiré de l'entraînement des grands modèles linguistiques (LLM), cet hybride de SGD Muon (de Moonshot AI) stabilise l'entraînement et accélère la convergence.
  • ProgLoss + STAL : l'intégration de Progressive Loss et Soft Task Alignment Loss améliore considérablement les performances en matière de détection de petits objets, un défi courant dans le domaine de l'imagerie aérienne et de la robotique.
  • Suppression DFL : la suppression de la perte focale de distribution simplifie le graphe du modèle, ce qui facilite l'exportation vers des formats tels que ONNX et TFLite plus claires et plus compatibles avec divers accélérateurs matériels.

Stabilité de l'entraînement avec MuSGD

L'optimiseur MuSGD de YOLO26 apporte la stabilité de l'entraînement LLM à la vision par ordinateur. En gérant de manière adaptative l'élan et les gradients, il réduit le besoin d'un réglage approfondi des hyperparamètres, permettant aux utilisateurs d'atteindre une précision optimale en moins d'époches par rapport SGD standard SGD AdamW.

Mesures de performance

Le tableau ci-dessous compare les performances de PP-YOLOE+ et YOLO26 sur l'ensemble COCO .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Principaux points à retenir :

  1. Efficacité : les modèles YOLO26 nécessitent systématiquement moins de FLOP et de paramètres pour une précision supérieure. Par exemple, YOLO26x atteint un mAP impressionnant de 57,5 avec seulement 55,7 millions de paramètres, tandis que PP-YOLOE+x nécessite 98,42 millions de paramètres pour atteindre 54,7 mAP.
  2. Vitesse d'inférence : YOLO26 affiche une vitesse supérieure sur les GPU (T4 TensorRT), le modèle Nano atteignant seulement 1,7 ms. CPU est également remarquable, offrant CPU jusqu'à 43 % plus rapide que les générations précédentes, ce qui le rend idéal pour les appareils sans accélérateurs dédiés.
  3. Précision : sur toutes les échelles, de Nano/Tiny à Extra Large, YOLO26 surpasse PP-YOLOE+ en termes de mAP l'ensemble COCO .

Écosystème et facilité d'utilisation

Lors du choix d'un modèle, l'écosystème environnant est aussi important que les indicateurs bruts.

Avantage de l'écosystème Ultralytics

Ultralytics , y compris YOLO26, bénéficient d'une plateforme unifiée et centrée sur l'utilisateur.

  • API simplifiée : une Python cohérente vous permet de passer de manière transparente de la détection à la segmentation, à l'estimation de la pose, à la classification et à l'OBB.
  • Ultralytics : la Ultralytics offre une solution sans code pour la gestion des ensembles de données, l'étiquetage et la formation en un clic dans le cloud.
  • Documentation : des documents complets et fréquemment mis à jour guident les utilisateurs à chaque étape, de l'installation au déploiement sur des appareils périphériques tels que Raspberry Pi.
  • Efficacité mémoire : YOLO26 est conçu pour être efficace en termes de mémoire pendant l'entraînement, ce qui permet d'utiliser des lots plus importants sur les GPU grand public par rapport aux alternatives gourmandes en mémoire.

Écosystème PaddlePaddle

PP-YOLOE+ est profondément intégré à PaddlePaddle Baidu PaddlePaddle . Bien que puissant, il nécessite souvent une chaîne d'outils spécifique (PaddleDetection) qui peut présenter une courbe d'apprentissage plus raide pour les utilisateurs habitués à PyTorch. Il excelle dans les environnements où l'intégration PaddlePaddle (comme les puces Baidu Kunlun) est une priorité.

Cas d'utilisation et applications

Analyse en temps réel à la périphérie

Pour les applications fonctionnant sur des appareils périphériques tels que les caméras intelligentes ou les drones, YOLO26 est clairement le grand gagnant. Sa conception de bout en bout NMS garantit une latence prévisible, ce qui est essentiel pour les systèmes de sécurité. Le nombre réduit de FLOP lui permet de fonctionner efficacement sur du matériel alimenté par batterie.

Automatisation Industrielle

Dans les environnements de fabrication exigeant une grande précision, tels que le contrôle qualité, les deux modèles sont performants. Cependant, la fonction ProgLoss de YOLO26 améliore la détection des petits défauts, ce qui lui confère un avantage pour repérer les imperfections minimes sur les chaînes de production.

Tâches visuelles complexes

Alors que PP-YOLOE+ se concentre principalement sur la détection, YOLO26 prend en charge un éventail plus large de tâches dès son installation.

Polyvalence multitâche

Contrairement à PP-YOLOE+, qui nécessite différentes architectures de modèles pour différentes tâches, Ultralytics vous Ultralytics de simplement changer la tête de tâche. Par exemple, passer à yolo26n-pose.pt permet instantanément la détection des points clés avec la même API familière.

Exemple de code : Démarrer avec YOLO26

La formation et le déploiement de YOLO26 sont incroyablement simples grâce àPython Ultralytics . L'extrait de code suivant montre comment charger un modèle pré-entraîné et effectuer une inférence sur une image.

from ultralytics import YOLO

# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")

# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
for result in results:
    result.show()  # Display predictions on screen
    result.save("output.jpg")  # Save annotated image to disk

Conclusion

PP-YOLOE+ et YOLO26 constituent tous deux des contributions impressionnantes à la vision par ordinateur. PP-YOLOE+ reste un choix solide pour les équipes qui ont déjà investi dans PaddlePaddle .

Cependant, pour la grande majorité des développeurs et des chercheurs, Ultralytics offre un package supérieur. Son architecture de bout en bout simplifie les pipelines de déploiement, tandis que sa précision de pointe et sa vitesse record en font le modèle le plus polyvalent pour 2026. Associé au soutien solide de Ultralytics et à des fonctionnalités telles que la Ultralytics , YOLO26 réduit considérablement le temps nécessaire entre la conception et la production.

Pour les utilisateurs intéressés par d'autres architectures modernes, la documentation couvre également d'excellentes alternatives telles que YOLO11 et le modèle basé sur un transformateur RT-DETR.


Commentaires