PP-YOLOE+ vs EfficientDet : comparaison technique complète

Le choix de la bonne architecture est une étape cruciale dans la création d'applications robustes de vision par ordinateur. Ce guide technique explore les compromis entre deux modèles de détection d'objets bien connus : PP-YOLOE+ et EfficientDet. Nous détaillerons leurs architectures, analyserons leurs métriques de performance et explorerons leurs scénarios de déploiement idéaux.

Bien que ces deux modèles aient apporté une contribution significative dans ce domaine, nous discuterons également de la manière dont des alternatives modernes telles Ultralytics offrent une efficacité mémoire nettement supérieure, une inférence plus rapide et une expérience de développement hautement rationalisée.

Aperçu architectural : PP-YOLOE+

PP-YOLOE+ est une version améliorée duYOLO original, spécialement conçue pour optimiser les performances des GPU côté serveur au sein de PaddlePaddle . Elle apporte plusieurs améliorations à l'architecture de base, en mettant l'accent sur un paradigme sans ancrage.

Auteurs : Auteurs de PaddlePaddle
Organisation :Baidu
Date : 2022-04-02
Arxiv :2203.16250
Docs :PaddleDetection README

En savoir plus sur PP-YOLOE+

PP-YOLOE+ dispose d'une structure CSPRepResNet, d'une tête alignée sur les tâches efficaces (ET-head) et s'appuie fortement sur la perte varifocale pour la classification, ainsi que sur la perte focale de distribution pour la régression des boîtes englobantes. Son passage à une conception de détecteur sans ancrage a permis de rationaliser le pipeline de post-traitement, le rendant très compétitif au moment de sa sortie.

Avantages de l'intégration

Les équipes qui ont déjà beaucoup investi dans PaddlePaddle de Baidu trouvent souvent que PP-YOLOE+ est plus facile à adopter pour des tâches telles que la segmentation d'instances, même s'il ne bénéficie pas de la large prise en charge multi-frameworks offerte par les outils plus récents.

Aperçu architectural : EfficientDet

EfficientDet adopte une approche radicalement différente de la détection d'objets, en s'appuyant fortement sur la recherche d'architecture neuronale et les principes de mise à l'échelle composée.

Auteurs : Mingxing Tan, Ruoming Pang et Quoc V. Le
Organisation :Google
Date : 2019-11-20
Arxiv :1911.09070
Documentation :README de Brain AutoML

En savoir plus sur EfficientDet

La pierre angulaire d'EfficientDet est son réseau pyramidal bidirectionnel (BiFPN). Contrairement aux FPN traditionnels, le BiFPN permet une fusion facile et rapide des caractéristiques à plusieurs échelles en introduisant des poids apprenables pour apprendre l'importance des différentes caractéristiques d'entrée. Associé à une structure EfficientNet, EfficientDet augmente systématiquement et simultanément la largeur, la profondeur et la résolution du réseau.

Bien que théoriquement très efficaces en termes de FLOP, les modèles EfficientDet peuvent parfois avoir du mal à traduire leur efficacité théorique en vitesse réelle sur les appareils périphériques en raison de leurs modèles d'accès à la mémoire complexes, ce qui contraste fortement avec les faibles exigences en mémoire des modèles YOLO.

Analyse des performances et benchmarks

Le tableau ci-dessous compare les indicateurs clés sur des ensembles de données standard tels que COCO. La comparaison entre la précision moyenne (mAP) et la vitesse d'inférence fournit une image claire de la frontière de Pareto.

Modèle	Taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	paramètres ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

Comme démontré, PP-YOLOE+ s'adapte généralement mieux en mAP brut pour les GPU haut de gamme, tandis qu'EfficientDet tente de minimiser les paramètres. Cependant, les deux sont en deçà des capacités temps réel modernes requises pour l'IA de pointe embarquée.

Cas d'utilisation et recommandations

Le choix entre PP-YOLOE+ et EfficientDet dépend de vos exigences spécifiques de projet, de vos contraintes de déploiement et de vos préférences d'écosystème.

Quand choisir PP-YOLOE+

PP-YOLOE+ est un choix judicieux pour :

Intégration à l'écosystème PaddlePaddle : Organisations disposant d'une infrastructure existante basée sur le framework et les outils PaddlePaddle de Baidu.
Déploiement Edge Paddle Lite : Déploiement sur du matériel avec des noyaux d'inférence hautement optimisés spécifiquement pour le moteur d'inférence Paddle Lite ou Paddle.
Détection côté serveur haute précision : scénarios donnant la priorité à une précision de détection maximale sur GPU puissants où la dépendance au framework n'est pas un problème.

Quand choisir EfficientDet

EfficientDet est recommandé pour :

Google et TPU : systèmes profondément intégrés aux API Google Vision ou à TPU , où EfficientDet dispose d'une optimisation native.
Recherche sur la mise à l'échelle composée : Évaluation comparative académique axée sur l'étude des effets de la mise à l'échelle équilibrée de la profondeur, de la largeur et de la résolution du réseau.
Déploiement mobile via TFLite : Projets nécessitant spécifiquement l'exportation TensorFlow Lite pour les appareils Android ou Linux embarqués.

Quand choisir Ultralytics YOLO26)

Pour la plupart des nouveaux projets, Ultralytics offre la meilleure combinaison entre performances et expérience développeur :

Déploiement Edge sans NMS : Applications nécessitant une inférence cohérente et à faible latence, sans la complexité du post-traitement de la Non-Maximum Suppression.
Environnements uniquement CPU : Les appareils sans accélération GPU dédiée, où l'inférence CPU de YOLO26, jusqu'à 43 % plus rapide, offre un avantage décisif.
Détection de petits objets: Scénarios difficiles comme l'imagerie aérienne par drone ou l'analyse de capteurs IoT où ProgLoss et STAL augmentent significativement la précision sur les objets minuscules.

L'alternative moderne : Ultralytics

Si PP-YOLOE+ et EfficientDet représentent des étapes historiques importantes, les développeurs à la recherche d'une précision de pointe, d'une consommation mémoire réduite et d'une expérience utilisateur simplifiée devraient se tourner vers Ultralytics .

YOLO26 représente une avancée considérable dans le domaine de la détection d'objets, grâce à plusieurs innovations majeures :

Conception de bout en bout sans NMS : S'appuyant sur les avancées de YOLOv10, YOLO26 élimine nativement la suppression non maximale (NMS) pendant l'inférence. Cela se traduit par une latence significativement plus faible et élimine les goulots d'étranglement complexes du post-traitement.
Optimiseur MuSGD : Inspiré par les innovations en matière d'entraînement des LLM, YOLO26 utilise un optimiseur hybride SGD et Muon. Cela améliore considérablement la stabilité de l'entraînement et réduit le temps de convergence.
Vitesse extrême : YOLO26 offre une inférence CPU jusqu'à 43 % plus rapide par rapport aux générations plus anciennes comme YOLO11, ce qui en fait le meilleur choix absolu pour les appareils périphériques alimentés par batterie ou uniquement CPU.
Fonctions de perte avancées : L'intégration de ProgLoss et STAL améliore grandement la reconnaissance des petits objets, ce qui est essentiel pour des tâches telles que l'analyse de drones et la robotique.

Polyvalence multitâche

Contrairement à EfficientDet qui se concentre uniquement sur la détection, YOLO26 gère nativement l'estimation de la pose, la classification d'images et les boîtes englobantes orientées (OBB), le tout au sein d'un même écosystème bien entretenu.

Facilité d'utilisation et intégration à l'écosystème

L'un des principaux inconvénients des modèles traditionnels tels qu'EfficientDet réside dans la complexité de leurs pipelines de formation et de leurs configurations d'apprentissage automatique. En revanche, la Ultralytics offre une expérience de développement inégalée.

Le déploiement d'un modèle avec Ultralytics ne nécessite que quelques lignes de code, offrant un contraste frappant avec les configurations verbeuses requises par les frameworks plus anciens.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100)

# Run inference on a test image natively without NMS overhead
predictions = model("https://ultralytics.com/images/bus.jpg")

Pour ceux qui explorent d'autres alternatives, des architectures telles que RT-DETR ou l'ancienne YOLOv8 sont également disponibles dans Ultralytics , ce qui permet de les échanger et de les tester en toute simplicité.

Conclusion

PP-YOLOE+ reste un choix solide pour les déploiements de serveurs spécifiques au sein de l'écosystème Paddle, et EfficientDet continue d'être une étude intéressante dans la conception d'architectures automatisées. Cependant, pour les applications modernes exigeant une inférence en temps réel, une facilité de déploiement et des besoins en mémoire minimaux, Ultralytics offre l'équilibre de performances le plus convaincant. Sa conception native NMS et CPU ultra-rapides en font le choix incontournable pour pérenniser votre infrastructure IA.