Passer au contenu

PP-YOLOE+ vs YOLOv10 : Une comparaison technique

Choisir le modèle de détection d'objets optimal est une décision cruciale qui équilibre la précision, la vitesse et les ressources de calcul pour tout projet de vision par ordinateur. Cette page fournit une comparaison technique détaillée entre PP-YOLOE+, développé par Baidu, et YOLOv10, un modèle de pointe de l'Université Tsinghua qui est entièrement intégré à l'écosystème Ultralytics. Nous analyserons leurs architectures, leurs métriques de performance et leurs cas d'utilisation idéaux pour vous aider à faire un choix éclairé.

PP-YOLOE+ : Haute précision dans l'écosystème PaddlePaddle

PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) est un modèle de détection d'objets "anchor-free" et "single-stage" issu du framework PaddleDetection de Baidu. Lancé en 2022, il vise principalement à offrir une haute précision tout en maintenant l'efficacité, en particulier pour les utilisateurs de l'environnement de deep learning PaddlePaddle.

Auteurs : Auteurs PaddlePaddle
Organisation : Baidu
Date : 2022-04-02
ArXiv : https://arxiv.org/abs/2203.16250
GitHub : https://github.com/PaddlePaddle/PaddleDetection/
Docs : https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

Architecture et principales fonctionnalités

PP-YOLOE+ améliore l'architecture YOLO standard avec plusieurs modifications clés pour améliorer les performances.

  • Conception sans ancres : En éliminant les boîtes d'ancrage prédéfinies, PP-YOLOE+ simplifie le pipeline de détection et réduit la complexité de l'ajustement des hyperparamètres. Cette approche est courante dans de nombreux détecteurs sans ancres modernes.
  • Composants efficaces : Il exploite un backbone ResNet et un neck Path Aggregation Network (PAN) pour une fusion efficace des caractéristiques, ce qui est une combinaison éprouvée pour équilibrer vitesse et précision.
  • Tête découplée : Le modèle sépare les tâches de classification et de régression au sein de la tête de détection, une technique connue pour améliorer la précision de la détection en empêchant l'interférence des tâches.
  • Apprentissage de l’alignement des tâches (TAL) : Il utilise une fonction de perte spécialisée conçue pour mieux aligner les tâches de classification et de localisation, ce qui permet d’obtenir des prédictions plus précises.

Points forts et faiblesses

PP-YOLOE+ a démontré de solides performances, mais il comporte certains compromis.

  • Points forts : Le modèle peut atteindre une très haute précision, en particulier avec ses variantes plus grandes. Sa conception sans point d’ancrage est efficace, et il est hautement optimisé pour les utilisateurs déjà investis dans le framework PaddlePaddle.
  • Points faibles : Son principal inconvénient est son couplage étroit avec l'écosystème PaddlePaddle. Cela peut créer une courbe d'apprentissage abrupte et des défis d'intégration pour les développeurs travaillant avec des frameworks plus courants comme PyTorch. De plus, le support de la communauté et les ressources disponibles peuvent être moins importants que pour les modèles de l'écosystème Ultralytics.

Cas d'utilisation

PP-YOLOE+ est bien adapté aux applications où une haute précision est une priorité et où l'environnement de développement est basé sur PaddlePaddle.

  • Inspection de qualité industrielle : Détection de petits défauts dans les processus de fabrication.
  • Commerce de détail intelligent : Alimente des applications telles que les systèmes de caisse automatisés et la gestion des stocks.
  • Automatisation du recyclage : Identification de différents matériaux pour les systèmes de tri automatisé.

En savoir plus sur PP-YOLOE+

YOLOv10 : Efficacité en temps réel de bout en bout

YOLOv10 Ultralytics est la dernière évolution de la série YOLO, développée par des chercheurs de l’université Tsinghua. Lancé en mai 2024, il introduit des changements architecturaux révolutionnaires pour réaliser une véritable détection d’objets en temps réel de bout en bout en éliminant les goulots d’étranglement du post-traitement et en optimisant le modèle pour une efficacité supérieure.

Auteurs : Ao Wang, Hui Chen, Lihao Liu, et al.
Organisation : Université Tsinghua
Date : 2024-05-23
ArXiv : https://arxiv.org/abs/2405.14458
GitHub : https://github.com/THU-MIG/yolov10
Docs : https://docs.ultralytics.com/models/yolov10/

Architecture et principales fonctionnalités

La philosophie de conception de YOLOv10 est axée sur l'efficacité holistique et la performance, ce qui en fait un choix exceptionnel pour un large éventail d'applications.

  • Formation sans NMS : L’innovation la plus importante de YOLOv10 est son utilisation d’affectations doubles cohérentes pendant la formation. Cela élimine le besoin de suppression non maximale (NMS) pendant le post-traitement, ce qui réduit considérablement la latence d’inférence et simplifie le pipeline de déploiement.
  • Conception holistique axée sur l’efficacité et la précision : Le modèle présente une optimisation complète de son backbone, de son neck et de sa head. Des innovations telles qu’une tête de classification légère et un sous-échantillonnage spatial-canal découplé réduisent la surcharge de calcul tout en préservant les informations riches sur les caractéristiques.
  • Efficacité et évolutivité supérieures : YOLOv10 offre une large gamme de modèles évolutifs, de Nano (N) à Extra-large (X). Ces modèles surpassent systématiquement leurs concurrents en offrant une plus grande précision avec moins de paramètres et un coût de calcul inférieur (FLOPs).
  • Avantage de l'écosystème Ultralytics : YOLOv10 est intégré de manière transparente dans l'écosystème Ultralytics. Cela offre aux utilisateurs une expérience inégalée, caractérisée par une facilité d'utilisation grâce à une simple API Python et une CLI, une documentation complète, un entraînement efficace avec des poids pré-entraînés facilement disponibles et des besoins en mémoire réduits. Le modèle est soutenu par une communauté robuste et un développement actif via Ultralytics HUB.

Points forts et faiblesses

YOLOv10 établit une nouvelle norme pour les détecteurs d'objets en temps réel.

  • Points forts : Vitesse et précision de pointe, une conception sans NMS véritablement de bout en bout, une efficacité de calcul exceptionnelle et une excellente évolutivité. Son intégration dans l’écosystème Ultralytics bien entretenu le rend incroyablement facile à former, à déployer et à maintenir.
  • Points faibles : En tant que modèle plus récent, la communauté et les outils tiers sont encore en développement par rapport aux modèles établis de longue date comme YOLOv8.

Cas d'utilisation

L'efficacité et la conception de bout en bout de YOLOv10 en font le choix idéal pour les applications où la vitesse et les contraintes de ressources sont essentielles.

En savoir plus sur YOLOv10

Analyse des performances : PP-YOLOE+ vs. YOLOv10

Les benchmarks de performance illustrent clairement les avantages de l'architecture moderne de YOLOv10. Bien que PP-YOLOE+x atteigne le mAP le plus élevé avec une faible marge, YOLOv10 offre systématiquement un meilleur équilibre entre vitesse, précision et efficacité pour toutes les tailles de modèles.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Par exemple, YOLOv10m atteint un mAP plus élevé que PP-YOLOE+m tout en étant plus rapide et en ayant beaucoup moins de paramètres (15,4 M contre 23,43 M). De même, YOLOv10l surpasse PP-YOLOE+l en précision avec près de la moitié des paramètres. Même au plus haut niveau, YOLOv10x est beaucoup plus efficace que PP-YOLOE+x, offrant une précision comparable avec une latence et des besoins de calcul bien moindres.

Conclusion : Quel modèle devriez-vous choisir ?

Bien que PP-YOLOE+ soit un modèle puissant pour les utilisateurs engagés dans le framework PaddlePaddle, YOLOv10 est la recommandation claire pour la grande majorité des développeurs et des chercheurs.

L'efficacité supérieure, l'architecture innovante sans NMS et les performances de pointe de YOLOv10 en font le choix le plus polyvalent et le plus pérenne. Son intégration transparente dans l'écosystème Ultralytics supprime les barrières à l'entrée, offrant une solution facile à utiliser, bien prise en charge et très performante pour un large éventail d'applications réelles, des appareils périphériques aux serveurs cloud haute performance.

Explorer d'autres modèles

Si vous explorez d'autres options, pensez à consulter d'autres modèles de pointe dans l'écosystème Ultralytics. Vous pouvez trouver des comparaisons détaillées comme YOLOv10 vs. YOLOv9 et YOLOv10 vs. YOLOv8. Pour ceux qui s'intéressent aux derniers développements, consultez le nouveau Ultralytics YOLO11.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires