Passer au contenu

YOLO PP-YOLOE+ : comparaison technique détaillée

Dans le domaine hautement concurrentiel de la vision par ordinateur en temps réel, il est essentiel de choisir l'architecture optimale pour vos besoins de déploiement spécifiques. Ce guide fournit une comparaison technique complète entre YOLO et PP-YOLOE+, en approfondissant leurs conceptions architecturales, leurs méthodologies de formation et leurs mesures de performance. Nous examinerons également comment ces modèles se comparent aux solutions de pointe telles que le tout nouveau Ultralytics .

Aperçus des modèles

Ces deux cadres ont vu le jour en 2022 comme des alternatives puissantes pour les applications industrielles, tirant parti de techniques sophistiquées pour repousser les limites de la précision et de la vitesse d'inférence.

DAMO-YOLO

Développé par le groupe Alibaba,YOLO plusieurs techniques novatrices pour optimiser le compromis entre latence et précision, en s'appuyant fortement sur des techniques de recherche automatisées et la fusion avancée de fonctionnalités.

YOLO une recherche d'architecture multi-échelle (MAE-NAS) pour concevoir automatiquement des structures optimisées pour l'efficacité matérielle. Il dispose également d'un réseau RepGFPN (Re-parameterized Generalized Feature Pyramid Network) efficace pour la fusion des caractéristiques du cou et d'une conception légère « ZeroHead ». De plus, il s'appuie fortement sur des techniques de distillation pendant l'entraînement afin d'améliorer la puissance de représentation du modèle étudiant.

En savoir plus sur DAMO-YOLO

PP-YOLOE+

Développé par PaddlePaddle Baidu PaddlePaddle , PP-YOLOE+ est une mise à niveau incrémentielle de l'architecture PP-YOLOE. Il se concentre sur le pré-entraînement à grande échelle et les fonctions de perte affinées afin d'offrir mAP élevé, en particulier dans son cadre d'apprentissage profond natif.

PP-YOLOE+ utilise une structure CSPRepResNet et une tête ET (Efficient Task-aligned head). La version « plus » introduit une puissante stratégie de pré-entraînement sur l'ensemble de données Objects365, qui améliore considérablement sa capacité à généraliser dans divers environnements réels.

En savoir plus sur PP-YOLOE+

Comparaison architecturale

La divergence dans la philosophie de conception entre ces deux modèles influence fortement leurs cas d'utilisation idéaux et leur compatibilité matérielle.

Fusion de fonctionnalités et structures de base

Les backbones générés par MAE-NASYOLO sont hautement adaptés aux appareils périphériques, offrant souvent un rapport vitesse/paramètres favorable. Cependant, ces architectures personnalisées peuvent être rigides et complexes à adapter à des tâches nouvelles telles que la segmentation d'instances. Le cou RepGFPN améliore la fusion de caractéristiques multi-échelles, mais ajoute de la complexité lors de la phase d'exportation de la reparamétrisation.

PP-YOLOE+ s'appuie sur le CSPRepResNet, plus traditionnel mais très efficace. Bien que cette architecture nécessite un plus grand nombre de paramètres queYOLO une précision similaire, elle est très stable à entraîner et plus facile à intégrer dans les pipelines existants. Son ET-head gère efficacement la classification et la régression, mais nécessite tout de même des étapes de post-traitement telles que la suppression non maximale (NMS).

Élimination des délais liés au post-traitement

YOLO PP-YOLOE+ nécessitent tous deux NMS le post-traitement des boîtes englobantes. Si la latence d'inférence est critique, envisagez d'utiliser Ultralytics , qui présente une conception native de bout en bout NMS. Cette approche révolutionnaire élimine NMS pour un pipeline de déploiement plus rapide et plus simple.

Analyse des performances et des indicateurs

Lors de l'évaluation de ces modèles pour la production, l'équilibre entre la précision (mAP), la vitesse d'inférence et la taille des paramètres est essentiel. Vous trouverez ci-dessous une comparaison directe de leurs principales variantes.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Comme le montre le tableau,YOLO atteintYOLO une latence plus faible à petite (s) et très petite (t) échelle, grâce à ses dorsales optimisées pour le NAS. Cependant, PP-YOLOE+ s'adapte incroyablement bien aux niveaux moyen (m) et grand (l), affichant mAP nettement plus élevés, même si cela se fait au détriment de TensorRT T4 TensorRT .

Besoins en mémoire et efficacité de l'apprentissage

La dépendanceYOLO à la distillation signifie que vous devez souvent entraîner un modèle enseignant beaucoup plus grand avant d'entraîner le modèle élève plus petit. Cela augmente considérablement les besoinsCUDA et le budget informatique global. PP-YOLOE+ simplifie cela grâce à un entraînement standard en une seule étape, mais reste étroitement lié au PaddlePaddle , ce qui peut limiter la flexibilité pour les équipes habituées à PyTorch.

En revanche, le modèle moderne Ultralytics résout ces goulots d'étranglement. Grâce au nouvel optimiseur MuSGD, un hybride de SGD Muon inspiré des innovations en matière de formation LLM, YOLO26 permet une convergence plus rapide et une formation très stable sans nécessiter de pipelines de distillation complexes. De plus, YOLO nécessitent généralement beaucoup moins CUDA pendant la formation que les détecteurs basés sur des transformateurs tels que RT-DETR.

Applications concrètes et cas d'utilisation idéaux

Quand utiliserYOLO

YOLO idéal pour l'inférence périphérique à haut débit où la latence est le principal goulot d'étranglement. Ses petites variantes excellent dans des environnements tels que les systèmes de gestion du trafic ou la surveillance de base par drone, à condition que votre équipe d'ingénieurs dispose de la bande passante nécessaire pour gérer ses processus complexes de distillation et de reparamétrage.

Quand utiliser PP-YOLOE+

PP-YOLOE+ est particulièrement performant lorsque vous êtes déjà fortement impliqué dans l'écosystème Baidu ou que vous gérez des déploiements de serveurs à grande échelle. Son impressionnant mAP le mAP adapté à l'analyse d'images médicales complexes ou à la détection de défauts de fabrication denses.

L'avantage Ultralytics

Bien queYOLO PP-YOLOE+ offrent tous deux des avantages spécifiques localisés, les développeurs à la recherche d'une polyvalence, d'une rapidité et d'une facilité d'utilisation maximales se tournent systématiquement vers la Ultralytics .

Lorsque vous mettez à niveau votre pipeline de vision par ordinateur, Ultralytics offre une expérience de développement inégalée :

  • CPU jusqu'à 43 % plus rapide : grâce à la suppression complète de la perte focale de distribution (DFL), YOLO26 est remarquablement rapide sur les CPU périphériques et les appareils IoT à faible consommation d'énergie.
  • Détection améliorée des petits objets : l'intégration des fonctions de perte ProgLoss et STAL apporte des améliorations spectaculaires dans la reconnaissance des petits objets, essentielle pour l'imagerie aérienne.
  • Grande polyvalence : contrairement à PP-YOLOE+, qui se concentre strictement sur la détection, YOLO26 gère de manière transparente l'estimation de la pose, les boîtes englobantes orientées (OBB) et la segmentation sémantique grâce à des améliorations architecturales spécifiques à chaque tâche.

Conclusion

YOLO PP-YOLOE+ représentent des étapes importantes dans l'évolution de la détection d'objets sans ancrage.YOLO les limites de la recherche d'architecture neuronale pour la latence périphérique, tandis que PP-YOLOE+ a démontré la puissance de la préformation à grande échelle.

Cependant, pour les développeurs qui recherchent le meilleur équilibre entre vitesse, précision et simplicité de déploiement, le modèle Ultralytics est le choix incontournable. Son architecture NMS, Python robuste et son intégration transparente avec des outils tels que Weights & Biases et TensorRT garantissent que vos projets passent sans encombre du prototype à la production.

Prêt à commencer ? Consultez le guideUltralytics ou comparez d'autres modèles dans notre aperçu YOLO11 YOLO.


Commentaires