Passer au contenu

YOLO11 YOLOv7: comparaison technique de l'architecture et des performances

Alors que le domaine de la vision par ordinateur connaît une accélération, le choix de la bonne architecture de détection d'objets devient essentiel pour réussir. Les deux principaux concurrents de la YOLO sont YOLO11, développé par Ultralytics, et YOLOv7, un modèle axé sur la recherche développé par Academia Sinica. Si ces deux modèles ont apporté une contribution significative à l'état de l'art, ils répondent à des besoins différents en termes de vitesse, de flexibilité et de facilité de déploiement.

Ce guide fournit une analyse technique approfondie de leurs architectures, de leurs indicateurs de performance et de leurs cas d'utilisation idéaux afin d'aider les développeurs et les chercheurs à choisir l'outil le mieux adapté à leurs projets.

Aperçu et origines des modèles

Comprendre la généalogie de ces modèles permet de mieux comprendre les choix architecturaux qui ont été faits.

YOLO11

Publié en septembre 2024 par Ultralytics, YOLO11 un perfectionnement de la philosophie axée sur la production de l'entreprise. Il a été conçu pour maximiser l'efficacité sur le matériel moderne, en équilibrant un débit élevé et une précision compétitive.

  • Auteurs : Glenn Jocher et Jing Qiu
  • Organisation :Ultralytics
  • Date : septembre 2024
  • Points forts : facilité d'utilisation en temps réel, prise en charge d'un large éventail de tâches (détection, segmentation, pose, OBB, classification) et déploiement simplifié via Ultralytics .

En savoir plus sur YOLO11

YOLOv7

Sorti en juillet 2022, YOLOv7 une avancée académique majeure introduite par l'équipe à l'origine de YOLOv4. Il a introduit plusieurs « bag-of-freebies » pour améliorer la précision sans augmenter le coût d'inférence, en se concentrant fortement sur les optimisations architecturales entraînables.

  • Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica
  • Date : juillet 2022
  • Points clés : analyse du chemin de gradient, reparamétrage du modèle et attribution dynamique d'étiquettes.

En savoir plus sur YOLOv7

Analyse des performances

Lorsqu'on compare ces architectures, des indicateurs tels que la précision moyenne (mAP) et la latence d'inférence sont primordiaux. Le tableau ci-dessous montre comment les nouvelles technologies utilisées dans YOLO11 par des gains d'efficacité par rapport à l'ancienne YOLOv7 .

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Points clés à retenir

  • Efficacité : le modèle YOLO11m atteint une précision légèrement supérieure (51,5 % mAP) à celle du modèle standard YOLOv7 51,4 %), tout en utilisant environ 45 % de paramètres en moins (20,1 millions contre 36,9 millions) et nettement moins de FLOP.
  • Vitesse : sur les GPU T4, YOLO11 surpassent systématiquement leurs YOLOv7 en termes de latence d'inférence, un facteur essentiel pour les applications en temps réel telles que la conduite autonome ou l'analyse vidéo.
  • Évolutivité : YOLO11 une gamme plus large d'échelles de modèles (de Nano à X-Large), ce qui facilite son déploiement sur du matériel aux ressources limitées, comme le Raspberry Pi ou les appareils mobiles.

Différences architecturales

Ultralytics YOLO11

YOLO11 sur les concepts fondamentaux du CSPNet (Cross-Stage Partial Network), mais affine la conception des blocs pour améliorer le flux de gradient et l'extraction des caractéristiques.

  • Backbone raffiné : utilise un bloc C3k2 amélioré (une implémentation plus rapide des goulots d'étranglement CSP) qui améliore la réutilisation des fonctionnalités tout en réduisant les calculs.
  • Détection sans ancrage : comme ses prédécesseurs immédiats, YOLO11 une tête sans ancrage, ce qui simplifie le processus d'entraînement en supprimant la nécessité d'un regroupement manuel des boîtes d'ancrage.
  • Têtes multitâches : l'architecture est conçue de manière native pour prendre en charge plusieurs tâches à l'aide d'une structure de tête unifiée, permettant une transition fluide entre la détection d'objets, la segmentation d'instances et l'estimation de poses.

YOLOv7

YOLOv7 « Extended-ELAN » (E-ELAN) pour contrôler efficacement les chemins de gradient les plus courts et les plus longs.

  • E-ELAN : bloc de calcul conçu pour permettre au réseau d'apprendre des caractéristiques plus diverses sans détruire le chemin du gradient.
  • Reparamétrage du modèle : utilise des techniques de reparamétrage (RepConv) pour fusionner des couches convolutives distinctes en une seule couche pendant l'inférence, ce qui augmente la vitesse sans perdre en précision d'entraînement.
  • Tête auxiliaire grossière à fine : introduit une tête auxiliaire pour la supervision de l'entraînement, qui facilite la supervision approfondie du modèle, mais ajoute de la complexité au pipeline d'entraînement.

L'évolution vers YOLO26

Si YOLO11 des améliorations significatives, la dernière version YOLO26 repousse encore plus loin les limites. Lancé en janvier 2026, YOLO26 présente une conception NMS de bout en bout, éliminant le besoin de post-traitement et accélérant CPU jusqu'à 43 %. Il adopte également l'optimiseur MuSGD, inspiré de la formation LLM, pour une convergence plus rapide .

Entraînement et facilité d'utilisation

Pour les développeurs, « l'expérience utilisateur » d'un modèle (sa facilité d'entraînement, de validation et de déploiement) est souvent aussi importante que les mesures brutes.

L'avantage de l'écosystème Ultralytics

YOLO11 entièrement intégré au Python Ultralytics , offrant un flux de travail « zéro à héros ».

  1. API unifiée : vous pouvez basculer entre YOLO11, YOLOv8ou YOLO26 en modifiant une seule chaîne.
  2. Efficacité mémoire : Ultralytics sont optimisés pour utiliser moins CUDA pendant l'entraînement par rapport à de nombreux référentiels de recherche. Cela permet d'utiliser des lots plus volumineux sur les GPU grand public.
  3. Exportation en un clic : exportation vers des formats tels que ONNX, TensorRT, CoreML ou TFLite via un mode à commande unique.
from ultralytics import YOLO

# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
path = model.export(format="onnx")

YOLOv7

YOLOv7 s'appuie YOLOv7 sur un référentiel autonome. Bien que puissant, il nécessite souvent :

  • Configuration manuelle de .yaml fichiers pour les ancres (si vous n'utilisez pas la version sans ancres).
  • Scripts « deploy » spécifiques pour fusionner les poids reparamétrés avant l'exportation.
  • Arguments de ligne de commande plus complexes pour gérer les têtes auxiliaires pendant l'entraînement.

Applications concrètes

Quand choisir YOLO11

YOLO11 le choix privilégié pour les applications commerciales et industrielles où la fiabilité et la maintenance sont essentielles.

  • IA en périphérie : grâce à la disponibilité des modèles « Nano » et « Small », YOLO11 est YOLO11 pour les caméras intelligentes et les appareils IoT qui surveillent les chaînes de fabrication.
  • Projets multitâches : si votre application nécessite le suivi d'objets tout en estimant simultanément des points clés (par exemple, l'analyse sportive), le cadre unifié YOLO11 simplifie la base de code.
  • Prototypage rapide : la facilité d'utilisation permet aux équipes d'itérer rapidement sur des ensembles de données personnalisés à l'aide de la Ultralytics , ce qui réduit les délais de mise sur le marché.

Quand choisir YOLOv7

  • Référence académique : si vous reproduisez les résultats tirés de la littérature 2022-2023 ou étudiez les effets spécifiques des architectures E-ELAN.
  • Systèmes hérités : pour les systèmes déjà profondément intégrés à la structure d'entrée/sortie spécifique des YOLO originales de type Darknet.

Conclusion

Alors que YOLOv7 reste une étape importante dans l'histoire de la détection d'objets, YOLO11 offre une solution plus moderne, plus efficace et plus conviviale pour les développeurs. Avec des rapports vitesse/précision supérieurs, des besoins en mémoire réduits et le soutien du solide Ultralytics , YOLO11 une voie plus claire pour un déploiement dans le monde réel.

Pour ceux qui recherchent le nec plus ultra, nous recommandons d'explorer YOLO26, qui s'appuie sur ces fondements avec une inférence NMS et des optimiseurs de nouvelle génération.

Ressources supplémentaires


Commentaires