Passer au contenu

Comparaison de modèles : YOLOv8 vs. YOLOv7 pour la détection d'objets

Le choix du bon modèle de détection d'objets est crucial pour obtenir des performances optimales dans les tâches de vision par ordinateur. Cette page offre une comparaison technique entre Ultralytics YOLOv8 et YOLOv7, deux modèles importants dans le domaine. Nous analyserons leurs nuances architecturales, leurs benchmarks de performance et leurs applications idéales pour guider votre processus de sélection de modèle, en soulignant les avantages offerts par l'écosystème Ultralytics. Bien que les deux modèles aient fait progresser l'état de l'art, YOLOv8 apparaît comme le choix supérieur pour les applications modernes en raison de ses performances améliorées, de sa polyvalence et de sa facilité d'utilisation exceptionnelle.

YOLOv8 : Efficacité et adaptabilité de pointe

Ultralytics YOLOv8, sorti en 2023, est le dernier modèle phare d'Ultralytics. Il s'appuie sur les succès de ses prédécesseurs, en introduisant un nouveau niveau de performance, de flexibilité et d'efficacité. En tant que modèle de pointe, YOLOv8 est conçu pour exceller dans un large éventail de tâches de vision par ordinateur.

Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
Organisation : Ultralytics
Date : 2023-01-10
GitHub : https://github.com/ultralytics/ultralytics
Docs : https://docs.ultralytics.com/models/yolov8/

Architecture et conception

YOLOv8 présente une architecture affinée à la fois puissante et conviviale. Les principales améliorations architecturales comprennent une nouvelle tête de détection sans ancres et un backbone plus efficace. La conception sans ancres réduit le nombre de prédictions de boîtes, ce qui simplifie les étapes de post-traitement telles que la suppression non maximale (NMS) et accélère la vitesse d’inférence. Cela rend YOLOv8 plus adaptable à diverses formes et tailles d’objets sans réglage manuel des ancres.

Points forts

  • Performances de pointe : YOLOv8 offre un équilibre exceptionnel entre précision et vitesse, surpassant les modèles précédents à toutes les échelles. Ses modèles plus petits sont plus rapides et plus précis que les variantes YOLOv7 comparables, tandis que ses modèles plus grands établissent de nouvelles normes en matière de précision.
  • Polyvalence inégalée : Contrairement à YOLOv7, qui est principalement un détecteur d’objets, YOLOv8 est un cadre unifié prenant en charge plusieurs tâches prêtes à l’emploi : détection d’objets, segmentation d’instance, estimation de pose, classification d’images et détection d’objets orientés (OBB).
  • Facilité d'utilisation : Ultralytics donne la priorité à une expérience de développement simplifiée. YOLOv8 est livré avec une API Python et une CLI simples, une documentation complète et une intégration transparente avec des outils tels que Ultralytics HUB pour l'entraînement et le déploiement sans code.
  • Écosystème bien maintenu : En tant que modèle Ultralytics officiel, YOLOv8 bénéficie d'un développement actif, de mises à jour fréquentes et d'une forte communauté open source. Cela garantit la fiabilité, l'accès aux dernières fonctionnalités et un support étendu.
  • Efficacité de l'entraînement et de la mémoire : Les modèles YOLOv8 sont conçus pour un entraînement efficace, nécessitant souvent moins de mémoire CUDA que d'autres architectures comme les transformateurs. Les poids pré-entraînés facilement disponibles sur des ensembles de données comme COCO permettent une convergence plus rapide sur des données personnalisées.

Faiblesses

  • En tant que modèle très avancé, les plus grandes variantes de YOLOv8 nécessitent des ressources de calcul importantes pour l’entraînement, bien qu’elles restent très efficaces pour leur niveau de performance.

Cas d'utilisation idéaux

Les performances supérieures et la polyvalence de YOLOv8 en font le choix idéal pour un large éventail d'applications, des appareils périphériques aux serveurs cloud.

En savoir plus sur YOLOv8

YOLOv7 : Une référence en matière de détection en temps réel

YOLOv7 a été présenté en 2022 comme une avancée importante dans la détection d’objets en temps réel, établissant une nouvelle référence lors de sa sortie. Il s’est concentré sur l’optimisation des processus de formation afin d’améliorer la précision sans augmenter les coûts d’inférence.

Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
Date : 2022-07-06
Arxiv : https://arxiv.org/abs/2207.02696
GitHub : https://github.com/WongKinYiu/yolov7
Docs : https://docs.ultralytics.com/models/yolov7/

Architecture et conception

YOLOv7 a introduit plusieurs innovations architecturales, notamment l'Extended Efficient Layer Aggregation Network (E-ELAN) dans son backbone pour améliorer l'efficacité de l'apprentissage. Sa contribution la plus notable a été le concept de "trainable bag-of-freebies", qui sont des stratégies d'entraînement qui améliorent la précision du modèle sans augmenter la surcharge d'inférence. Il s'agit notamment de techniques telles que les têtes auxiliaires et l'attribution d'étiquettes grossière à fine.

Points forts

  • Hautes performances lors de sa sortie : YOLOv7 offrait une excellente combinaison de vitesse et de précision, surpassant les autres détecteurs disponibles à l’époque.
  • Entraînement efficace : Le concept de « bag-of-freebies » lui a permis d'atteindre une grande précision avec des routines d'entraînement optimisées.
  • Benchmark établi : C’est un modèle bien considéré qui a été largement testé sur des ensembles de données standard comme MS COCO.

Faiblesses

  • Polyvalence limitée : YOLOv7 est principalement un détecteur d’objets. L’étendre à d’autres tâches comme la segmentation ou l’estimation de pose nécessite des implémentations distinctes, souvent communautaires, contrairement à l’approche intégrée de YOLOv8.
  • Complexité architecturale : Les techniques d’apprentissage et les composants architecturaux peuvent être plus complexes à comprendre et à modifier que la conception simplifiée de YOLOv8.
  • Dépassé par les modèles plus récents : Bien que puissant, YOLOv7 a été surpassé en termes de vitesse et de précision par YOLOv8. L'écosystème Ultralytics offre également une expérience plus conviviale et complète.

Cas d'utilisation idéaux

YOLOv7 reste un modèle performant pour les applications où il a été intégré avant la sortie de nouvelles alternatives.

  • Systèmes de sécurité en temps réel : Convient aux applications telles que la prévention du vol où une détection rapide et précise est essentielle.
  • Projets existants : Une option viable pour maintenir ou étendre les systèmes existants basés sur l’architecture YOLOv7.

En savoir plus sur YOLOv7

Performances et analyses comparatives : YOLOv8 vs. YOLOv7

La comparaison des performances illustre clairement les avancées réalisées avec YOLOv8. De manière générale, les modèles YOLOv8 offrent un meilleur compromis entre la précision et la vitesse.

Modèle Taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

D'après les données, plusieurs informations clés émergent :

  • Précision supérieure : Le plus grand modèle, YOLOv8x, atteint un mAP de 53,9, dépassant le mAP de 53,1 du modèle YOLOv7x.
  • Vitesse inégalée : Les modèles YOLOv8 sont nettement plus rapides, en particulier sur CPU. Le modèle YOLOv8n affiche un temps d’inférence de seulement 80,4 ms sur CPU avec ONNX, une mesure non disponible pour YOLOv7 mais manifestement plus rapide dans la pratique. Sur GPU, YOLOv8n atteint un incroyable 1,47 ms avec TensorRT, dépassant de loin l’efficacité de YOLOv7.
  • Plus grande efficacité : Les modèles YOLOv8 ont moins de paramètres et de FLOPs pour des performances comparables ou meilleures. Par exemple, YOLOv8l atteint presque le même mAP que YOLOv7x (52,9 contre 53,1), mais avec beaucoup moins de paramètres (43,7M contre 71,3M) et de FLOPs (165,2B contre 189,9B).

Conclusion : pourquoi YOLOv8 est le choix privilégié

Bien que YOLOv7 ait été un modèle formidable, YOLOv8 est le grand gagnant pour les nouveaux projets et développements. Son architecture supérieure, ses performances de pointe et son incroyable polyvalence en font l'outil le plus puissant et le plus convivial disponible pour la détection d'objets et d'autres tâches de vision par ordinateur.

L'écosystème intégré Ultralytics offre un avantage significatif, offrant une expérience transparente de l'entraînement au déploiement. Pour les développeurs et les chercheurs à la recherche d'un modèle robuste, bien pris en charge et performant, YOLOv8 est le choix définitif.

Explorer d'autres modèles

Pour ceux qui souhaitent explorer davantage, Ultralytics propose une gamme de modèles et de comparaisons. Pensez à consulter :

  • YOLOv8 vs YOLOv5 : Comparez YOLOv8 avec un autre modèle largement adopté et efficace.
  • YOLOv8 vs RT-DETR : Découvrez comment YOLOv8 se compare aux architectures basées sur les transformateurs.
  • YOLO11 vs. YOLOv8 : Explorez les avancées du dernier modèle Ultralytics, YOLO11.


📅 Créé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires