Passer au contenu

YOLOv8 vs YOLO11 : Une comparaison technique détaillée

Lors de la sélection d'un modèle de vision par ordinateur, en particulier pour la détection d'objets, il est essentiel de comprendre les forces et les faiblesses des différentes architectures. Cette page offre une comparaison technique détaillée entre Ultralytics YOLOv8 et Ultralytics YOLO11, deux modèles de pointe d'Ultralytics conçus pour la détection d'objets et d'autres tâches de vision. Nous analyserons leurs nuances architecturales, leurs benchmarks de performance et leurs applications appropriées pour vous guider dans la prise d'une décision éclairée pour votre projet.

Ultralytics YOLOv8

Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation : Ultralytics
Date : 2023-01-10
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolov8/

Lancé au début de 2023, YOLOv8 est rapidement devenu une référence pour la détection d'objets en temps réel, offrant un bond significatif en termes de performances par rapport aux versions précédentes. Il a introduit un mécanisme de détection sans ancrage et un nouveau backbone basé sur CSPDarknet53, ce qui a amélioré à la fois la précision et la vitesse. YOLOv8 est un modèle très polyvalent, prenant en charge une gamme complète de tâches d'IA de vision, y compris la détection, la segmentation d'instance, l'estimation de pose et la classification d'image.

Architecture et principales fonctionnalités

L'architecture de YOLOv8 est conçue pour l'efficacité et la flexibilité. Sa tête sans ancrage réduit le nombre de prédictions de boîtes, simplifiant le pipeline de post-traitement et accélérant l'inférence. Le modèle a été conçu comme un framework complet, et pas seulement comme un modèle unique, fournissant une plateforme unifiée pour la formation de modèles pour diverses tâches. Cette intégration dans l'écosystème Ultralytics signifie que les utilisateurs bénéficient d'un flux de travail rationalisé, de la formation au déploiement, soutenu par une documentation complète et un ensemble d'outils robustes.

Points forts

  • Performance éprouvée : Un modèle très fiable et largement adopté qui a établi les normes de l'industrie en matière de performance et de vitesse.
  • Polyvalence des tâches : Un framework unique et unifié capable de gérer la détection, la segmentation, la classification et l’estimation de pose.
  • Écosystème mature : Bénéficie d’un grand nombre de tutoriels communautaires, d’intégrations tierces et d’un déploiement généralisé dans les environnements de production.
  • Facilité d'utilisation : Comporte une API Python et une CLI simples, le rendant accessible aux débutants comme aux experts.

Faiblesses

  • Bien qu'il reste un excellent performeur, sa précision et sa vitesse ont été surpassées par son successeur, YOLO11, en particulier dans les scénarios limités par le CPU.
  • Les modèles plus grands (YOLOv8l, YOLOv8x) peuvent être gourmands en calcul, nécessitant d'importantes ressources GPU pour des performances en temps réel.

Cas d'utilisation

YOLOv8 reste un excellent choix pour un large éventail d'applications, en particulier celles où la stabilité et un écosystème mature sont valorisés. Il excelle dans :

  • Automatisation industrielle : Pour le contrôle qualité et la détection des défauts dans le secteur de la fabrication.
  • Systèmes de sécurité : Alimenter les systèmes de sécurité avancés pour la surveillance en temps réel et la détection des intrusions.
  • Analyse de vente au détail : Amélioration de la gestion des stocks et analyse du comportement des clients.

En savoir plus sur YOLOv8

Ultralytics YOLO11

Auteurs : Glenn Jocher et Jing Qiu
Organisation : Ultralytics
Date : 2024-09-27
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolo11/

YOLO11 est la dernière évolution de la série Ultralytics YOLO, conçue pour une précision et une efficacité supérieures. S'appuyant sur les bases solides de YOLOv8, YOLO11 introduit des améliorations architecturales qui optimisent l'extraction et le traitement des caractéristiques. Il en résulte une précision de détection plus élevée avec moins de paramètres et des vitesses d'inférence plus rapides, en particulier sur les CPU. Comme son prédécesseur, YOLO11 est un modèle multitâche prenant en charge la détection, la segmentation, la classification, l'estimation de pose et les boîtes englobantes orientées (OBB) au sein du même cadre simplifié.

Architecture et principales fonctionnalités

YOLO11 affine la structure du réseau pour atteindre un meilleur équilibre entre le coût de calcul et la performance. Il atteint une plus grande précision avec un nombre de paramètres et moins de FLOPs par rapport à YOLOv8, comme le montre le tableau de performance ci-dessous. Cette efficacité le rend très approprié pour un déploiement sur une large gamme de matériel, des appareils périphériques aux ressources limitées aux puissants serveurs cloud. Un avantage clé de YOLO11 est son intégration transparente dans l'écosystème Ultralytics bien maintenu, qui assure une excellente expérience utilisateur, des processus d'entraînement efficaces avec des poids pré-entraînés facilement disponibles, et une utilisation de la mémoire plus faible pendant l'entraînement et l'inférence.

Points forts

  • Précision à la pointe de la technologie : Offre des scores mAP plus élevés que YOLOv8 pour toutes les tailles de modèles, établissant une nouvelle norme pour la détection d'objets.
  • Efficacité améliorée : Offre des vitesses d’inférence considérablement plus rapides, en particulier sur le CPU, tout en nécessitant moins de paramètres et de FLOPs.
  • Équilibre des performances : Fournit un compromis exceptionnel entre la vitesse et la précision, ce qui le rend idéal pour diverses applications réelles.
  • Évolutivité et polyvalence: Fonctionne bien sur divers matériels et prend en charge plusieurs tâches de vision par ordinateur dans un framework unique et facile à utiliser.
  • Écosystème bien maintenu : Bénéficie d'un développement actif, d'un fort soutien de la communauté via GitHub et Discord, et de mises à jour fréquentes.

Faiblesses

  • Étant un modèle plus récent, il peut initialement avoir moins d'intégrations tierces par rapport au YOLOv8 plus établi.
  • Les modèles les plus grands (par exemple, YOLO11x) nécessitent toujours une puissance de calcul substantielle pour l'entraînement et le déploiement, une caractéristique commune aux détecteurs de haute précision.

Cas d'utilisation

YOLO11 est le choix recommandé pour les nouveaux projets qui exigent les plus hauts niveaux de précision et de performance en temps réel. Son efficacité le rend idéal pour :

  • Robotique : Permet une navigation précise et l’interaction avec des objets dans les systèmes autonomes.
  • Soins de santé : Aide à l’analyse d’images médicales pour des applications telles que la détection de tumeurs.
  • Villes intelligentes : Alimenter des systèmes intelligents de gestion du trafic et de sécurité publique.

En savoir plus sur YOLO11

Comparaison directe des performances : YOLOv8 contre YOLO11

La principale distinction entre YOLOv8 et YOLO11 réside dans les performances. YOLO11 surpasse systématiquement YOLOv8 en offrant une plus grande précision (mAP) avec une plus grande efficacité (moins de paramètres et des vitesses plus rapides). Par exemple, YOLO11l atteint un mAP plus élevé (53,4) que YOLOv8l (52,9) avec près de 42 % de paramètres en moins et est considérablement plus rapide sur le CPU. Cette tendance se maintient sur toutes les variantes de modèles, ce qui fait de YOLO11 un successeur plus puissant et plus efficace.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusion et recommandation

YOLOv8 et YOLO11 sont tous deux des modèles exceptionnels, mais ils répondent à des besoins légèrement différents.

  • YOLOv8 est un modèle robuste et mature, ce qui en fait un choix sûr pour les projets qui sont déjà construits sur cette base ou qui dépendent fortement de son vaste écosystème d'outils et de tutoriels tiers existants. Il reste un choix formidable pour un large éventail de tâches de vision par ordinateur.

  • YOLO11 est le grand gagnant en termes de performances et d'efficacité. Il représente le summum de la détection d'objets en temps réel. Pour tout nouveau projet, YOLO11 est le point de départ recommandé. Sa précision supérieure, ses vitesses d'inférence plus rapides (en particulier sur CPU) et son architecture plus efficace offrent un avantage significatif et pérennisent votre application. Le support et le développement continus au sein de l'écosystème Ultralytics consolident encore sa position de premier choix pour les développeurs et les chercheurs.

Pour ceux qui souhaitent explorer d'autres modèles, Ultralytics prend également en charge une gamme d'architectures, y compris le YOLOv5 de base, le récent YOLOv9 et les modèles basés sur des transformateurs comme RT-DETR. Vous pouvez trouver plus de comparaisons sur notre page de comparaison de modèles.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires