Passer au contenu

YOLOv7 vs YOLO26 : Évolution de la détection d'objets en temps réel

Le domaine de la vision par ordinateur évolue rapidement, chaque nouvelle génération de modèles repoussant les limites de ce qui est possible en matière d'analyse en temps réel. Cette comparaison exhaustive explore les différences entre le modèle hérité YOLOv7 et le modèle de pointe YOLO26, en analysant leurs architectures, leurs métriques de performance et leurs scénarios de déploiement idéaux. Alors que YOLOv7 représentait une étape importante en 2022, YOLO26 introduit des innovations révolutionnaires telles que le traitement de bout en bout et des stratégies d'optimisation dérivées de l'entraînement des grands modèles linguistiques (LLM).

Aperçu du modèle

YOLOv7

Lancé en juillet 2022, YOLOv7 a introduit le concept de « bag-of-freebies entraînable », optimisant le processus d'entraînement pour améliorer la précision sans augmenter les coûts d'inférence. Il s'est fortement concentré sur des réformes architecturales telles que les réseaux d'agrégation de couches efficaces étendus (E-ELAN) et les techniques de mise à l'échelle des modèles.

Auteurs : Chien-Yao Wang, Alexey Bochkovskiy, et Hong-Yuan Mark Liao
Organisation :Institute of Information Science, Academia Sinica, Taiwan
Date : 2022-07-06
ArXiv :2207.02696
GitHub :WongKinYiu/yolov7

Ultralytics YOLO26

YOLO26, lancé début 2026, représente un changement de paradigme dans la lignée YOLO. Il est conçu pour une efficacité maximale sur les appareils périphériques et un déploiement simplifié. Les innovations clés incluent une conception native de bout en bout sans NMS, qui élimine le besoin de post-traitement complexe, et la suppression de la Distribution Focal Loss (DFL) pour simplifier l'exportabilité.

Auteurs : Glenn Jocher et Jing Qiu
Organisation :Ultralytics
Date : 2026-01-14
Documentation :Ultralytics YOLO26
GitHub :ultralytics/ultralytics

En savoir plus sur YOLO26

Comparaison technique

Le tableau suivant met en évidence le bond de performance de YOLOv7 à YOLO26. Alors que YOLOv7 a établi des références en son temps, YOLO26 offre une vitesse et une efficacité supérieures, en particulier pour l'inférence basée sur le CPU.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Analyse des performances

YOLO26l surpasse la précision du bien plus lourd YOLOv7x (55,0 vs 53,1 mAP) tout en utilisant significativement moins de paramètres (24,8M vs 71,3M) et de FLOPs (86,4B vs 189,9B). Cette efficacité rend YOLO26 idéal pour les environnements à ressources limitées où l'optimisation du modèle est critique.

Différences architecturales

Architecture YOLOv7

L'architecture de YOLOv7 repose sur l'E-ELAN (Extended Efficient Layer Aggregation Network), qui permet au réseau d'apprendre des caractéristiques plus diverses en contrôlant les chemins de gradient les plus courts et les plus longs. Il utilise également la mise à l'échelle du modèle pour les modèles basés sur la concaténation, ajustant simultanément la profondeur et la largeur du réseau. Cependant, YOLOv7 s'appuie toujours sur des têtes de détection basées sur des ancres et nécessite une suppression non maximale (NMS) pendant le post-traitement pour filtrer les boîtes englobantes dupliquées. Cette étape de NMS peut constituer un goulot d'étranglement lors du déploiement, nécessitant souvent une implémentation personnalisée pour différents backends matériels comme TensorRT ou CoreML.

Architecture de YOLO26

YOLO26 introduit plusieurs changements radicaux conçus pour simplifier l'expérience utilisateur et améliorer les performances :

  • De bout en bout sans NMS : En adoptant une architecture native de bout en bout (initiée par YOLOv10), YOLO26 élimine le besoin de NMS. Le modèle produit directement les détections finales, réduisant la latence et simplifiant considérablement les pipelines de déploiement.
  • Suppression de la DFL : La suppression de la Distribution Focal Loss simplifie la tête de sortie, rendant le modèle plus compatible avec les appareils périphériques et les formats à faible précision comme INT8.
  • Optimiseur MuSGD : Inspiré par les innovations dans l'entraînement des grands modèles linguistiques (LLM) comme Kimi K2 de Moonshot AI, YOLO26 utilise un optimiseur MuSGD hybride. Celui-ci combine l'élan du SGD avec les propriétés adaptatives de l'optimiseur Muon, ce qui se traduit par un entraînement plus stable et une convergence plus rapide.
  • Optimisation pour les petits objets : L'intégration de l'équilibrage progressif des pertes (ProgLoss) et de l'affectation d'étiquettes sensible aux petites cibles (STAL) répond directement aux défis courants de la détection de petits objets, rendant YOLO26 particulièrement efficace pour l'imagerie aérienne et les applications IoT.

Entraînement et convivialité

Facilité d'utilisation

L'une des caractéristiques de l' écosystème Ultralytics est l'accessibilité. Alors que YOLOv7 nécessite le clonage d'un dépôt spécifique et la gestion de fichiers de configuration complexes, YOLO26 est directement intégré au ultralytics package python. Cela offre une API unifiée pour l'entraînement, la validation et le déploiement.

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single line of code
results = model.train(data="coco8.yaml", epochs=100)

Polyvalence

YOLOv7 se concentre principalement sur la détection d'objets et l'estimation de pose. En revanche, YOLO26 propose un cadre unifié prenant en charge un éventail plus large de tâches de vision par ordinateur, notamment :

  • Segmentation d'instance : Avec des fonctions de perte spécialisées pour un masquage précis.
  • Estimation de pose : Utilisant l'estimation de log-vraisemblance résiduelle (RLE) pour des points clés précis.
  • Boîtes englobantes orientées (obb) : Dotées d'une fonction de perte angulaire spécialisée pour les objets pivotés.
  • Classification : Pour une catégorisation efficace des images.

Efficacité de l'entraînement

Le processus d'entraînement de YOLO26 est hautement optimisé. L'optimiseur MuSGD permet une convergence plus rapide, ce qui signifie que les utilisateurs peuvent souvent obtenir de meilleurs résultats en moins d'époques par rapport aux optimiseurs plus anciens. De plus, l'empreinte mémoire réduite des modèles YOLO26 permet des tailles de lot plus importantes sur le même matériel, accélérant ainsi davantage le cycle d'entraînement. C'est un avantage significatif par rapport aux modèles basés sur des transformeurs, qui nécessitent généralement une mémoire CUDA substantielle.

Applications concrètes

Points forts de YOLOv7

YOLOv7 reste un modèle performant pour les chercheurs intéressés par les propriétés architecturales spécifiques des réseaux ELAN ou ceux qui maintiennent des systèmes hérités basés sur l'architecture de type Darknet. Il constitue un excellent point de référence pour la comparaison académique.

Points forts de YOLO26

YOLO26 est le choix recommandé pour la plupart des applications modernes en raison de son équilibre de performance et de sa facilité de déploiement :

  • Informatique en périphérie (Edge Computing) : Avec une inférence CPU jusqu'à 43 % plus rapide, YOLO26 est parfait pour fonctionner sur Raspberry Pi, les appareils mobiles ou les serveurs locaux sans GPU dédiés.
  • Robotique et systèmes autonomes : La conception de bout en bout réduit la variabilité de la latence, ce qui est essentiel pour la prise de décision en temps réel en robotique. L'amélioration de la détection de petits objets (via STAL) facilite la navigation et l'évitement d'obstacles.
  • Déploiement commercial : La suppression de NMS et DFL simplifie le processus d'exportation vers des formats comme ONNX, TensorRT et CoreML, garantissant un comportement cohérent dans différents environnements de déploiement.
  • Surveillance agricole : La haute précision dans la détection de petits objets rend YOLO26 excellent pour des tâches telles que l'identification de ravageurs ou le comptage de cultures à partir d'images de drones.

Migration depuis YOLOv7

Les utilisateurs migrant de YOLOv7 vers YOLO26 trouveront la transition transparente grâce à l'API Ultralytics. Les vastes améliorations en termes de vitesse et de facilité d'exportation justifient généralement la mise à niveau pour les systèmes de production. Pour ceux qui recherchent d'autres alternatives modernes, YOLO11 est une autre option robuste entièrement prise en charge par l'écosystème Ultralytics.

Conclusion

Alors que YOLOv7 a été une contribution significative à la communauté open-source, YOLO26 représente l'avenir de la vision par ordinateur efficace. En s'attaquant aux goulots d'étranglement critiques comme NMS et en tirant parti des techniques d'optimisation modernes issues du monde des LLM, YOLO26 offre un modèle non seulement plus rapide et plus léger, mais aussi beaucoup plus facile à entraîner et à déployer.

Pour les développeurs recherchant une solution fiable, bien entretenue et polyvalente, YOLO26 est le choix supérieur. Son intégration dans l'écosystème Ultralytics garantit l'accès à des mises à jour continues, une documentation complète et une communauté de soutien florissante.

En savoir plus sur YOLO26


Commentaires