Passer au contenu

PP-YOLOE+ vs YOLOv5 : Une comparaison technique détaillée

Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre la précision, la vitesse et la facilité de mise en œuvre. Cette page fournit une comparaison technique approfondie entre PP-YOLOE+, un modèle efficace de Baidu, et Ultralytics YOLOv5, un modèle largement adopté et éprouvé par l'industrie. Nous explorerons leurs architectures, leurs mesures de performance et leurs cas d'utilisation idéaux pour vous aider à faire un choix éclairé pour vos projets de vision par ordinateur.

PP-YOLOE+ : Haute précision dans l'écosystème PaddlePaddle

PP-YOLOE+ est un détecteur sans ancrage à une seule étape développé par Baidu. Sorti en 2022, il s'appuie sur le modèle PP-YOLOE en mettant l'accent sur l'obtention d'un équilibre supérieur entre la précision et la vitesse, en particulier au sein du framework de deep learning PaddlePaddle.

Détails techniques :

Architecture et principales fonctionnalités

PP-YOLOE+ introduit plusieurs améliorations architecturales pour améliorer les performances :

  • Conception sans ancres : En éliminant les boîtes d'ancrage prédéfinies, PP-YOLOE+ simplifie le pipeline de détection et réduit le nombre d'hyperparamètres à ajuster.
  • Backbone et Neck efficaces : Il utilise un backbone efficace comme CSPRepResNet et un Path Aggregation Network (PAN) pour une fusion efficace des caractéristiques à plusieurs échelles.
  • Tête découplée : Le modèle utilise une tête découplée (ET-Head) qui sépare les tâches de classification et de régression, ce qui conduit souvent à une précision améliorée.
  • Fonction de perte avancée : Elle utilise l’apprentissage de l’alignement des tâches (TAL) et la fonction de perte VariFocal pour mieux aligner les scores de classification et la précision de la localisation, ce qui permet d’obtenir des détections plus précises. Vous pouvez explorer d’autres fonctions de perte dans la documentation Ultralytics.

Points forts et faiblesses

  • Points forts:
    • Potentiel de haute précision, surpassant souvent d’autres modèles en mAP sur les ensembles de données de référence.
    • Vitesses d'inférence efficaces, en particulier lorsqu'elles sont optimisées avec TensorRT sur les GPU.
    • L'approche sans ancres peut simplifier le pipeline d'entraînement dans certains scénarios.
  • Faiblesses:
    • Verrouillage de l'écosystème : Principalement conçu pour et optimisé au sein du framework PaddlePaddle, ce qui peut créer un obstacle important pour les développeurs habitués à PyTorch ou à d'autres écosystèmes.
    • Communauté plus petite : La communauté et les ressources disponibles sont moins importantes que le vaste écosystème qui entoure les modèles Ultralytics YOLO.
    • Complexité : L'intégration dans des flux de travail autres que PaddlePaddle peut être complexe et chronophage.

Cas d'utilisation

PP-YOLOE+ est un excellent choix pour les applications où l'obtention de la plus grande précision possible est une priorité, en particulier pour les équipes opérant déjà dans l'écosystème PaddlePaddle.

  • Inspection de la qualité industrielle : Sa haute précision est bénéfique pour détecter les défauts subtils dans la fabrication.
  • Commerce de détail intelligent : Peut être utilisé pour une gestion des stocks précise et l’analyse de la clientèle.
  • Recherche : Un modèle précieux pour les chercheurs explorant les architectures sans ancres et les fonctions de perte avancées.

En savoir plus sur PP-YOLOE+

Ultralytics YOLOv5 : la norme industrielle établie

Ultralytics YOLOv5, publié en 2020 par Glenn Jocher, est rapidement devenu une référence industrielle en raison de son mélange exceptionnel de vitesse, de précision et de convivialité pour les développeurs. Construit en PyTorch, il est réputé pour son processus de formation et de déploiement simple, le rendant accessible aux débutants comme aux experts.

Détails techniques :

Architecture et principales fonctionnalités

L'architecture de YOLOv5 est hautement optimisée pour l'efficacité et la performance :

  • Backbone : Il utilise un backbone CSPDarknet53, qui équilibre efficacement la charge de calcul et les capacités d’extraction des caractéristiques.
  • Cou : Un agrégateur de caractéristiques PANet améliore la capacité du modèle à détecter des objets à différentes échelles.
  • Head : Elle utilise une tête de détection basée sur des ancres, qui est robuste et s’est avérée efficace dans un large éventail de tâches de détection d’objets.
  • Scalabilité : YOLOv5 est disponible en différentes tailles (n, s, m, l, x), permettant aux développeurs de choisir le compromis parfait entre vitesse et précision pour leurs besoins spécifiques, des appareils périphériques légers aux puissants serveurs cloud.

Points forts et faiblesses

  • Points forts:
    • Facilité d'utilisation : YOLOv5 est célèbre pour son expérience utilisateur simplifiée, avec une API Python simple, une CLI facile à utiliser et une documentation exhaustive.
    • Écosystème bien maintenu : Il est soutenu par l'écosystème complet Ultralytics, qui comprend un développement actif, une communauté large et utile, des mises à jour fréquentes et des outils tels que Ultralytics HUB pour la formation et le déploiement sans code.
    • Équilibre des performances : Il offre un équilibre exceptionnel entre la vitesse d’inférence et la précision, ce qui le rend idéal pour les applications en temps réel.
    • Efficacité de l'entraînement : YOLOv5 dispose d'un processus d'entraînement efficace avec des poids pré-entraînés facilement disponibles, permettant une convergence plus rapide et réduisant le temps de développement.
    • Polyvalence : Au-delà de la détection d'objets, YOLOv5 prend également en charge la segmentation d'instance et la classification d'images, offrant une solution flexible pour de multiples tâches de vision.
  • Faiblesses:
    • Bien que très précis, les plus grands modèles PP-YOLOE+ peuvent atteindre un mAP légèrement supérieur sur certains benchmarks.
    • Son approche basée sur des ancres peut nécessiter un certain réglage pour les ensembles de données avec des rapports d’aspect d’objet non conventionnels.

Cas d'utilisation

La vitesse, l'efficacité et la facilité de déploiement de YOLOv5 en font un choix de premier ordre pour un large éventail d'applications :

  • Analyse vidéo en temps réel : Parfait pour les systèmes de sécurité, la surveillance du trafic et la surveillance.
  • Déploiement en périphérie (Edge Deployment) : Les modèles plus petits (YOLOv5n, YOLOv5s) sont hautement optimisés pour les appareils aux ressources limitées comme Raspberry Pi et NVIDIA Jetson.
  • Automatisation industrielle : Largement utilisée pour le contrôle qualité, la détection des défauts et la robotique dans les environnements automatisés.

En savoir plus sur YOLOv5

Analyse des performances : PP-YOLOE+ vs. YOLOv5

Les performances de PP-YOLOE+ et YOLOv5 mettent en évidence leurs différentes philosophies de conception. Les modèles PP-YOLOE+ atteignent généralement des scores mAP plus élevés, ce qui démontre leur force en matière de précision. Par exemple, PP-YOLOE+l atteint 52,9 mAP, dépassant les 49,0 mAP de YOLOv5l. Cependant, cette précision a un coût.

YOLOv5, d'autre part, est un leader incontesté en termes de vitesse et d'efficacité d'inférence. Ses modèles plus petits sont exceptionnellement rapides, ce qui les rend idéaux pour les applications en temps réel sur CPU et GPU. Le tableau ci-dessous montre que, bien que PP-YOLOE+ soit très rapide sur GPU avec TensorRT, YOLOv5 offre une solution plus accessible et souvent plus rapide, en particulier pour les développeurs qui ont besoin de déployer sur une variété de matériel sans optimisation poussée.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusion : Quel modèle devriez-vous choisir ?

Le choix entre PP-YOLOE+ et YOLOv5 dépend fortement des priorités de votre projet et de votre pile technique existante.

  • PP-YOLOE+ est une excellente option si votre objectif principal est de maximiser la précision de la détection et que vous travaillez déjà dans l'écosystème Baidu PaddlePaddle ou que vous êtes prêt à l'adopter. Sa conception moderne sans ancrage et ses fonctions de perte avancées repoussent les limites de la performance.

  • Ultralytics YOLOv5 est le choix recommandé pour la grande majorité des développeurs et des applications. Sa facilité d’utilisation imbattable, son équilibre de performances exceptionnel et son incroyable flexibilité de déploiement en font une solution plus pratique et efficace. L’écosystème Ultralytics robuste et bien maintenu offre un soutien inégalé, de l’entraînement à la production, assurant un cycle de développement plus fluide et plus rapide. Pour les projets qui exigent une vitesse en temps réel, une mise en œuvre simple et un fort soutien communautaire, YOLOv5 reste le choix supérieur.

Explorer d'autres modèles

Bien que YOLOv5 soit un modèle puissant et mature, Ultralytics continue d'innover. Pour ceux qui recherchent les dernières avancées, envisagez d'explorer les modèles plus récents comme YOLOv8, YOLOv10 et le YOLO11 à la pointe de la technologie. Ces modèles s'appuient sur les points forts de YOLOv5, offrant des performances encore meilleures et plus de fonctionnalités. Pour des analyses plus détaillées, visitez la page de comparaison des modèles d'Ultralytics.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires