Skip to content

Comparaison des modèles : PP-YOLOE+ vs YOLO11 pour la détection d'objets

Lors du choix d'un modèle de vision artificielle pour la détection d'objets, il est essentiel de comprendre les forces et les faiblesses des différentes architectures. Cette page propose une comparaison technique détaillée entre PP-YOLOE+ et Ultralytics YOLO11, deux modèles de pointe, afin de vous aider à prendre une décision éclairée.

Ultralytics YOLO11: Efficacité et polyvalence à la pointe de la technologie

Ultralytics YOLO11, rédigé par Glenn Jocher et Jing Qiu d'Ultralytics et publié le 2024-09-27, est la dernière itération de la célèbre série YOLO . Il est conçu pour la détection d'objets en temps réel et excelle dans l'équilibre entre vitesse et précision dans diverses applications. YOLO11 s'appuie sur les modèles YOLO précédents, en introduisant des améliorations architecturales pour améliorer les performances et la polyvalence dans des tâches telles que la classification d'images, la segmentation d'instances et l'estimation de la pose.

Architecture et caractéristiques principales

YOLO11 conserve le paradigme de la détection en une seule étape, sans ancrage, en donnant la priorité à la vitesse d'inférence. Les principales caractéristiques architecturales sont les suivantes

  • Efficient Backbone (épine dorsale efficace) : Une épine dorsale rationalisée pour une extraction rapide des caractéristiques.
  • Évolutivité : Disponible en plusieurs tailles (n, s, m, l, x) pour répondre aux différents besoins de calcul et environnements de déploiement, depuis les appareils périphériques comme NVIDIA Jetson jusqu'aux serveurs en nuage.
  • Polyvalence : Prend en charge diverses tâches de vision artificielle au-delà de la détection d'objets, offrant ainsi une solution flexible au sein de l'écosystème Ultralytics .

Mesures de performance

YOLO11 offre un bon équilibre entre vitesse et précision, ce qui le rend adapté aux applications en temps réel.

  • mAP : Permet d'obtenir une précision moyenne de pointe (mAP) sur des ensembles de données tels que COCO. Consultez le guide des mesures de performance deYOLO pour plus de détails sur la mAP et d'autres mesures d'évaluation.
  • Vitesse d'inférence : Optimisée pour une inférence rapide, cruciale pour les besoins de traitement en temps réel, comme c'est le cas pour l'IA visionnaire dans les applications de flux.
  • Taille du modèle : Le modèle reste compact, ce qui facilite le déploiement sur des appareils dont les ressources sont limitées.

En savoir plus sur YOLO11

Forces et faiblesses

Points forts :

  • Polyvalent et précis : Il excelle dans diverses tâches de vision, offrant une grande précision et une grande rapidité.
  • Un écosystème convivial : Intégration transparente au sein de l'écosystème Ultralytics , avec des fonctionnalités complètes en Python et une documentation complète sur l'utilisation de l'CLI programmation.
  • Déploiement évolutif : Plusieurs tailles de modèles garantissent l'adaptabilité à différents matériels.

Faiblesses :

  • Demande de calcul : Les modèles de grande taille peuvent être très gourmands en ressources informatiques et nécessitent un matériel puissant pour une performance optimale en temps réel.
  • Complexité pour les nouveaux utilisateurs : Bien que conviviale, la mise au point et la compréhension des nuances de l'architecture peuvent représenter une courbe d'apprentissage pour les nouveaux utilisateurs de la vision par ordinateur.

Cas d'utilisation idéaux

YOLO11 est bien adapté aux applications exigeant une détection d'objets en temps réel avec une grande précision :

  • Analyse vidéo en temps réel : Les applications telles que la gestion des files d'attente et les systèmes de sécurité bénéficient de sa rapidité et de sa précision.
  • Déploiement de l'IA en périphérie : Efficace pour le traitement sur appareil sur des plateformes telles que Raspberry Pi.
  • Systèmes autonomes : Idéal pour les voitures autonomes et la robotique nécessitant une perception rapide et précise, comme le souligne la vision AI dans les applications de conduite autonome.

PP-YOLOE+ : Précision et efficacité

PP-YOLOE+ (Practical YOLO with Evolved Enhancement), développé par les auteurs de PaddlePaddle à Baidu et publié le 2022-04-02, est conçu pour la détection d'objets de haute précision avec une efficacité raisonnable. Il s'agit d'une version améliorée de la série PP-YOLOE, axée sur les applications industrielles où la précision est primordiale. PP-YOLOE+ donne la priorité à la précision sans sacrifier de manière significative la vitesse d'inférence et fait partie du zoo de modèles PaddleDetection.

Architecture et caractéristiques principales

PP-YOLOE+ adopte également une approche sans ancrage, mettant l'accent sur la précision et l'efficacité. Ses principales caractéristiques sont les suivantes :

  • Objectif de haute précision : L'architecture a été affinée pour atteindre une précision de premier ordre dans les tâches de détection d'objets.
  • Conception efficace : Équilibre la précision avec une vitesse d'inférence efficace, adaptée aux applications exigeantes.
  • Intégration dePaddlePaddle : Exploite le cadre d'apprentissage profond PaddlePaddle , en bénéficiant de ses optimisations et de son écosystème.

Mesures de performance

PP-YOLOE+ excelle dans la précision tout en maintenant une vitesse compétitive :

  • Précision moyenne élevée : Précision moyenne élevée (mAP), démontrant une grande précision sur des ensembles de données de référence tels que COCO, comme indiqué dans la documentation PP-YOLOE+.
  • Inférence efficace : Offre un bon équilibre entre la précision et la vitesse d'inférence, adapté aux applications industrielles nécessitant une analyse en temps réel.
  • Taille du modèle : Offre plusieurs tailles de modèles pour s'adapter aux différentes ressources informatiques.

En savoir plus sur PP-YOLOE+

Forces et faiblesses

Points forts :

  • Précision exceptionnelle : Priorité à la haute précision de détection, cruciale pour les applications de précision critiques telles que l'inspection de la qualité dans la fabrication.
  • Objectif industriel : Bien adapté aux environnements industriels nécessitant une détection fiable et précise des objets.
  • L'écosystèmePaddlePaddle : Bénéficie de l'écosystème et des optimisations du framework PaddlePaddle .

Faiblesses :

  • Verrouillage de l'écosystème : Principalement au sein de l'écosystème PaddlePaddle , ce qui peut être une considération pour les utilisateurs profondément ancrés dans d'autres frameworks comme PyTorch utilisé par Ultralytics YOLO.
  • Moins polyvalent dans le contexte Ultralytics : Bien qu'il soit capable, il n'est pas aussi intégré que YOLO11 dans le cadre d'Ultralytics pour la polyvalence des tâches.

Cas d'utilisation idéaux

PP-YOLOE+ convient parfaitement aux applications où la précision est primordiale :

Tableau de comparaison des modèles

Modèle taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusion

PP-YOLOE+ et YOLO11 sont tous deux des modèles de détection d'objets robustes, chacun présentant des avantages uniques. YOLO11 constitue une solution polyvalente et performante au sein de l'écosystème Ultralytics , idéale pour les applications nécessitant un équilibre entre vitesse et précision pour diverses tâches de vision. PP-YOLOE+ excelle en termes de précision et d'efficacité, ce qui est particulièrement bénéfique pour les utilisateurs du cadre PaddlePaddle et pour ceux qui privilégient la précision dans les environnements industriels.

Les utilisateurs intéressés par l'exploration d'autres modèles au sein de l'écosystème Ultralytics peuvent également envisager :

  • YOLOv8 - Un modèle très polyvalent et convivial de la série YOLO .
  • YOLOv9 - Connu pour ses progrès en matière de précision et d'efficacité.
  • YOLO - Modèles conçus à l'aide d'une recherche d'architecture neuronale pour optimiser les performances.
  • RT-DETR - Real-Time DEtection Transformer, qui offre une approche architecturale différente.
  • YOLOv7, YOLOv6 et YOLOv5 - Les versions précédentes de la famille YOLO , chacune avec ses propres caractéristiques de performance et ses points forts.
📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires