Skip to content

YOLO11 vs YOLOv7 : Comparaison technique détaillée pour la détection d'objets

Le choix du bon modèle de détection d'objets est crucial pour obtenir des performances optimales dans les tâches de vision par ordinateur. Cette page propose une comparaison technique détaillée entre Ultralytics YOLO11 et YOLOv7, deux modèles avancés conçus pour une détection d'objets efficace et précise. Nous examinerons leurs nuances architecturales, leurs performances et les applications appropriées afin de vous aider à prendre une décision éclairée.

Ultralytics YOLO11

Ultralytics YOLO11, rédigé par Glenn Jocher et Jing Qiu d'Ultralytics et publié le 2024-09-27, est la dernière évolution de la série YOLO . Il se concentre sur l'amélioration de la précision et de l'efficacité de la détection d'objets, ce qui le rend polyvalent pour un large éventail d'applications dans le monde réel. Ultralytics YOLO11 s'appuie sur les modèles YOLO précédents, en affinant la structure du réseau pour atteindre une précision de détection de pointe tout en conservant des performances en temps réel.

Architecture et caractéristiques principales :

L'architecture de YOLO11 intègre des techniques avancées d'extraction de caractéristiques, ce qui se traduit par une plus grande précision avec un nombre réduit de paramètres par rapport à des modèles comme YOLOv8. Cette optimisation permet d'accélérer la vitesse du moteur d'inférence et de réduire les besoins de calcul, ce qui le rend apte à être déployé sur diverses plates-formes, des appareils périphériques à l'infrastructure en nuage. YOLO11 prend en charge de nombreuses tâches de vision par ordinateur, notamment la détection d'objets, la segmentation d'instances, la classification d'images et l'estimation de la pose. Le modèle est disponible sur GitHub.

Indicateurs de performance et repères :

YOLO11 affiche des scores impressionnants de précision moyenne (mAP) pour différentes tailles de modèles. Par exemple, YOLO11m atteint une mAPval50-95 de 51,5 pour une taille d'image de 640, équilibrant efficacement la vitesse et la précision. Les variantes plus petites comme YOLO11n et YOLO11s offrent une inférence en temps réel plus rapide pour les applications qui privilégient la vitesse, tandis que les modèles plus grands comme YOLO11x maximisent la précision. Pour obtenir des mesures détaillées des performances deYOLO , consultez la documentation Ultralytics .

Cas d'utilisation :

La précision et l'efficacité accrues de YOLO11 en font un outil idéal pour les applications nécessitant une détection précise et en temps réel des objets :

  • Robotique: Pour une navigation précise et une interaction avec les objets dans des environnements dynamiques.
  • Systèmes de sécurité: Dans les systèmes d'alarme de sécurité avancés pour une détection précise des intrusions et une surveillance complète.
  • Analyse de la vente au détail: Pour l'IA dans le commerce de détail afin d'améliorer la gestion des stocks et l'analyse approfondie du comportement des clients.
  • Automatisation industrielle: Pour un contrôle rigoureux de la qualité et une détection efficace des défauts dans les processus de fabrication.

Points forts :

  • Haute précision: Permet d'atteindre une mAP de pointe grâce à des architectures raffinées.
  • Inférence efficace: Traitement rapide adapté aux applications en temps réel.
  • Tâches polyvalentes: Prise en charge de la détection d'objets, de la segmentation, de la classification et de l'estimation de la pose.
  • Évolutivité: Performances efficaces sur différents types de matériel, depuis les dispositifs périphériques jusqu'aux systèmes en nuage.

Faiblesses :

  • Les grands modèles peuvent nécessiter davantage de ressources informatiques que les petits modèles optimisés en termes de vitesse.
  • L'optimisation pour des périphériques spécifiques peut nécessiter des configurations de déploiement de modèles supplémentaires.

En savoir plus sur YOLO11

YOLOv7

YOLOv7, présenté en juillet 2022 par Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao de l'Institut des sciences de l'information de l'Academia Sinica (Taïwan), est connu pour son "bag-of-freebies" entraînable qui établit un nouvel état de l'art pour les détecteurs d'objets en temps réel. Détaillé dans son article arXiv et son dépôt GitHub, YOLOv7 met l'accent sur la vitesse et l'efficacité tout en maintenant une grande précision dans les tâches de détection d'objets.

Architecture et caractéristiques principales :

YOLOv7 s'appuie sur le réseau d'agrégation de couches efficace (ELAN) et introduit l'Extended-ELAN (E-ELAN) pour améliorer la capacité d'apprentissage du réseau. Il utilise des techniques telles que le re-paramétrage du modèle et l'attribution dynamique d'étiquettes pour améliorer l'efficacité de l'apprentissage et la vitesse d'inférence. YOLOv7 est conçu pour la détection d'objets de haute performance dans diverses applications.

Indicateurs de performance et repères :

YOLOv7 démontre d'excellentes performances, atteignant un mAP de 51,4% sur l'ensemble de données COCO à une taille d'image de 640. Sa vitesse est également remarquable, le modèle de base YOLOv7 atteignant 161 FPS dans l'inférence du lot 1. Pour des benchmarks de performance détaillés, consultez le dépôt GitHub officiel de YOLOv7.

Cas d'utilisation :

L'équilibre entre la vitesse et la précision de YOLOv7 permet de l'utiliser pour un large éventail d'applications, notamment

  • Détection d'objets en temps réel: Idéal pour les applications nécessitant une détection rapide, telles que la conduite autonome et l'analyse vidéo en accéléré.
  • Calcul à haute performance: Convient aux environnements où les ressources informatiques sont disponibles et où la précision est prioritaire par rapport à la vitesse.
  • Recherche et développement: Un modèle de base solide pour la poursuite de la recherche sur les architectures de détection d'objets et les méthodologies de formation.

Points forts :

  • Grande vitesse: Permet d'atteindre des vitesses d'inférence impressionnantes, adaptées aux systèmes en temps réel.
  • Bonne précision: Fournit des scores mAP compétitifs sur des ensembles de données de référence.
  • Architecture efficace: Utilise E-ELAN et le re-paramétrage du modèle pour améliorer les performances.

Faiblesses :

  • Peut nécessiter davantage de ressources informatiques que les modèles plus petits et plus récents tels que YOLO11n pour les scénarios de déploiement en périphérie.
  • L'architecture, bien qu'efficace, est moins polyvalente que YOLO11 en ce qui concerne la prise en charge de diverses tâches de vision au-delà de la détection d'objets.

En savoir plus sur YOLOv7

Tableau de comparaison des modèles

Modèle taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Conclusion

YOLO11 et YOLOv7 sont tous deux de puissants modèles de détection d'objets, chacun possédant des atouts uniques. YOLO11 excelle en termes de polyvalence et d'efficacité, prenant en charge de multiples tâches de vision avec une précision et une rapidité de pointe, ce qui en fait un choix judicieux pour diverses applications et environnements de déploiement. YOLOv7, tout en étant également efficace, est particulièrement optimisé pour la détection d'objets à grande vitesse, adaptée aux applications en temps réel et à la recherche. Le choix entre ces deux systèmes dépend des exigences spécifiques de votre projet, en tenant compte de facteurs tels que la polyvalence des tâches, les besoins en matière de précision et les contraintes de déploiement.

Pour les utilisateurs intéressés par d'autres modèles, Ultralytics propose également YOLOv8, connu pour son efficacité et sa polyvalence, et YOLOv5, largement adopté pour sa rapidité et sa facilité d'utilisation. Vous pouvez également envisager de comparer YOLO11 avec YOLOv9 ou d'explorer des modèles tels que RT-DETR pour différentes approches architecturales de la détection d'objets.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires