PP-YOLOE+ vs YOLOv7 : Une comparaison technique pour la détection d'objets
Le choix du bon modèle de détection d'objets est une étape essentielle dans tout projet de vision par ordinateur, nécessitant un équilibre minutieux entre la précision, la vitesse et les ressources de calcul. Cette page fournit une comparaison technique détaillée entre PP-YOLOE+ et YOLOv7, deux modèles de détection d'objets influents. Nous examinerons en profondeur leurs conceptions architecturales, leurs benchmarks de performance, leurs méthodologies d'entraînement et leurs cas d'utilisation idéaux pour vous aider à prendre une décision éclairée en fonction de vos besoins spécifiques.
PP-YOLOE+ : Sans ancres et polyvalente
PP-YOLOE+, développé par les auteurs de PaddlePaddle chez Baidu, est un détecteur sans ancrage haute performance de la suite PaddleDetection. Il s'appuie sur le succès de ses prédécesseurs en introduisant des améliorations au niveau du backbone, du neck et de la tête, visant un équilibre supérieur entre précision et efficacité.
- Auteurs : Auteurs de PaddlePaddle
- Organisation : Baidu
- Date : 2022-04-02
- ArXiv : https://arxiv.org/abs/2203.16250
- GitHub : https://github.com/PaddlePaddle/PaddleDetection/
- Documentation : https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
Architecture et entraînement
PP-YOLOE+ se distingue par une architecture "anchor-free", qui simplifie le pipeline de détection en éliminant le besoin de "anchor boxes" prédéfinies et leur réglage d'hyperparamètres associé. Ce choix de conception conduit souvent à un entraînement et une inférence plus rapides. Le modèle dispose d'une tête découplée pour les tâches de classification et de localisation, permettant à chaque branche d'apprendre des caractéristiques plus spécialisées. Un élément clé est son utilisation de VariFocal Loss, un type de fonction de perte qui priorise les exemples difficiles pendant l'entraînement, et Task Alignment Learning (TAL) pour améliorer l'alignement des caractéristiques entre la classification et la localisation.
Performance
En tant que modèle sans ancrage, PP-YOLOE+ offre un compromis solide entre vitesse et précision pour ses différentes tailles de modèle (t, s, m, l, x). Cette évolutivité le rend adaptable à différents matériels et exigences de performance. Les modèles affichent des scores mAP compétitifs et des temps d'inférence rapides, en particulier lorsqu'ils sont accélérés avec des outils tels que TensorRT, ce qui les rend adaptés à un large éventail d'applications.
Cas d'utilisation
Les performances équilibrées et la conception sans ancres font de PP-YOLOE+ un excellent choix pour les applications où une détection robuste est nécessaire sans sacrifier la vitesse. Il excelle dans des scénarios tels que l'inspection de la qualité industrielle, où il peut identifier les défauts sur les lignes de production, et l'amélioration de l'efficacité du recyclage en triant avec précision les matériaux. Son efficacité permet un déploiement sur divers matériels, des serveurs puissants aux appareils périphériques plus limités.
Points forts et faiblesses
- Points forts : La conception sans ancres simplifie l'implémentation et réduit le réglage des hyperparamètres. Il offre un excellent compromis précision/vitesse et est bien intégré dans le framework PaddlePaddle.
- Points faibles : Sa conception principale pour l'écosystème PaddlePaddle peut nécessiter des efforts supplémentaires pour l'intégration dans d'autres frameworks comme PyTorch. Le soutien de la communauté, bien que solide, pourrait être moins étendu que pour les modèles plus largement adoptés comme la série Ultralytics YOLO.
YOLOv7 : Optimisé pour la vitesse et l'efficacité
YOLOv7, qui fait partie de la célèbre famille YOLO, a établi une nouvelle référence en matière de détecteurs d'objets en temps réel lors de sa sortie. Elle se concentre sur la fourniture d'une vitesse et d'une précision exceptionnelles grâce à des optimisations architecturales et à des stratégies d'entraînement avancées.
- Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
- Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
- Date : 2022-07-06
- ArXiv : https://arxiv.org/abs/2207.02696
- GitHub : https://github.com/WongKinYiu/yolov7
- Docs : https://docs.ultralytics.com/models/yolov7/
Architecture et entraînement
YOLOv7 a introduit plusieurs innovations architecturales, notamment l'Extended Efficient Layer Aggregation Network (E-ELAN) dans son backbone. E-ELAN améliore la capacité d'apprentissage du réseau sans perturber le chemin de gradient, améliorant ainsi l'efficacité de l'extraction de caractéristiques. Le modèle intègre également un "trainable bag-of-freebies", un ensemble de techniques d'entraînement qui améliorent la précision sans augmenter le coût d'inférence. Il s'agit notamment de la re-paramétrisation du modèle et de l'entraînement guidé grossier à fin, comme indiqué dans l'article de YOLOv7.
Performance
YOLOv7 est célébré pour son équilibre exceptionnel entre vitesse et précision. Comme le souligne sa documentation, des modèles comme YOLOv7
atteint 51,4 % de mAP à 161 FPS sur un GPU V100, surpassant significativement de nombreux contemporains. Cette haute efficacité en fait un choix de premier ordre pour les applications exigeantes inférence en temps réel.
Cas d'utilisation
Les capacités à haute vitesse de YOLOv7 le rendent idéal pour les applications où une faible latence est essentielle. Cela inclut les systèmes d'alarme de sécurité, l'estimation de la vitesse des véhicules et les systèmes autonomes tels que la robotique. Son efficacité facilite également le déploiement sur des plateformes périphériques telles que NVIDIA Jetson.
Points forts et faiblesses
- Points forts : Compromis entre vitesse et précision à la pointe de la technologie. Son architecture très efficace est idéale pour les applications en temps réel et en périphérie. Il dispose d'une large base d'utilisateurs et de nombreuses ressources communautaires.
- Points faibles : En tant que modèle basé sur des ancres, il peut nécessiter un réglage plus minutieux des configurations d'ancres pour des performances optimales sur des ensembles de données personnalisés par rapport aux alternatives sans ancres. Bien que puissants, de nouveaux modèles ont depuis vu le jour avec des écosystèmes plus intégrés.
Analyse des performances : PP-YOLOE+ vs. YOLOv7
Une comparaison directe des mesures de performance révèle les avantages distincts de chaque modèle. PP-YOLOE+ offre une plus large gamme de tailles de modèles, permettant des compromis plus granulaires entre la précision et l’utilisation des ressources. YOLOv7, d’autre part, repousse les limites des performances en temps réel.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
D'après le tableau, PP-YOLOE+x atteint la mAP la plus élevée, soit 54,7, mais au prix d'une latence plus élevée. YOLOv7x offre une alternative intéressante avec une mAP légèrement inférieure de 53,1, mais une vitesse d'inférence plus rapide. Les plus petits modèles PP-YOLOE+, comme t
et s
, offrent une inférence extrêmement rapide, ce qui les rend idéaux pour les environnements à ressources très limitées.
Pourquoi choisir les modèles Ultralytics YOLO ?
Bien que PP-YOLOE+ et YOLOv7 soient tous deux des modèles puissants, le paysage de la détection d'objets est en constante évolution. Pour les développeurs et les chercheurs à la recherche du framework le plus moderne, polyvalent et convivial, les modèles Ultralytics YOLO tels que YOLOv8 et YOLO11 présentent un choix supérieur.
- Facilité d'utilisation : Les modèles Ultralytics sont conçus pour offrir une expérience utilisateur simplifiée, avec une API Python simple, une documentation complète et des commandes CLI directes.
- Écosystème bien maintenu : Les modèles font partie d'un écosystème complet avec un développement actif, une forte communauté open source et une intégration avec des outils tels que Ultralytics HUB pour un MLOps transparent.
- Performance et efficacité : Les modèles Ultralytics atteignent un excellent compromis entre vitesse et précision. Ils sont conçus pour une utilisation efficace de la mémoire pendant l’entraînement et l’inférence, nécessitant souvent moins de mémoire CUDA que d’autres architectures.
- Polyvalence : Les modèles tels que YOLOv8 et YOLO11 sont des solutions multitâches, prenant en charge la détection d’objets, la segmentation, la classification, l’estimation de pose et la détection d’objets orientés (OBB) dans un cadre unique et unifié.
- Efficacité de l'entraînement : Bénéficiez de processus d'entraînement efficaces, de poids pré-entraînés facilement disponibles sur des ensembles de données tels que COCO, et de temps de convergence plus rapides.
Conclusion
PP-YOLOE+ et YOLOv7 sont tous deux des modèles de détection d'objets formidables qui ont repoussé les limites du possible. PP-YOLOE+ offre une solution sans ancrage évolutive et efficace, particulièrement intéressante au sein de l'écosystème PaddlePaddle. YOLOv7 se distingue par sa vitesse brute et sa précision, ce qui en fait un choix de prédilection pour les applications en temps réel exigeantes.
Cependant, pour les développeurs à la recherche d'une solution complète et évolutive, les modèles Ultralytics tels que YOLOv8 et YOLO11 offrent un ensemble plus attrayant. Leur combinaison de performances de pointe, de facilité d'utilisation, de polyvalence multitâche et d'un écosystème robuste et bien maintenu en fait le choix idéal pour un large éventail de projets de vision par ordinateur, de la recherche universitaire au déploiement en production.
Explorer d'autres modèles
Pour une exploration plus approfondie, considérez ces comparaisons impliquant PP-YOLOE+, YOLOv7 et d'autres modèles de premier plan :
- YOLOv7 vs. YOLOv8
- YOLOv7 vs. YOLOv5
- RT-DETR vs. YOLOv7
- PP-YOLOE+ vs. YOLOv8
- YOLOX vs. YOLOv7
- Explorez les derniers modèles comme YOLOv10 et YOLO11.