Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs YOLOv7#

La progression rapide de la vision par ordinateur au cours des dernières années a permis de créer des architectures de plus en plus efficaces pour les applications en temps réel. Comparer YOLOv10 et YOLOv7 met en lumière une période de transition cruciale dans cette évolution. Alors que YOLOv7 a introduit des stratégies d'entraînement et une mise à l'échelle architecturale très efficaces, YOLOv10 a révolutionné le déploiement en éliminant la dépendance historique au Non-Maximum Suppression (NMS).

Les deux modèles ont repoussé les limites de la détection d'objets lors de leurs sorties respectives, mais l'écosystème Ultralytics moderne et l'introduction de modèles de nouvelle génération comme YOLO26 offrent des flux de travail bien supérieurs pour les praticiens de l'IA d'aujourd'hui.

Link to this sectionProfils et origines des modèles#

Comprendre les origines de ces modèles fournit un contexte précieux sur leurs choix de conception architecturale et la recherche universitaire qui les soutient.

Link to this sectionDétails de YOLOv10#

En savoir plus sur YOLOv10

Link to this sectionDétails de YOLOv7#

En savoir plus sur YOLOv7

Link to this sectionInnovations architecturales#

Link to this sectionL'approche YOLOv7#

Sorti en 2022, YOLOv7 s'est fortement concentré sur l'optimisation des chemins de gradient. Il a introduit l'E-ELAN (Extended Efficient Layer Aggregation Network), qui permet au modèle d'apprendre des caractéristiques plus diversifiées sans détruire le chemin de gradient original. De plus, les auteurs ont mis en œuvre une méthodologie de « trainable bag-of-freebies », utilisant des techniques de re-paramétrage pendant l'entraînement qui peuvent être fusionnées lors de l'inférence pour maintenir des vitesses d'exécution rapides. Malgré ces optimisations impressionnantes, YOLOv7 dépendait toujours fortement du NMS pour le post-traitement, créant une latence variable lors de l'analyse de scènes denses.

Link to this sectionLa percée de YOLOv10#

YOLOv10 a directement résolu le goulot d'étranglement du NMS. En introduisant des assignations doubles cohérentes pendant l'entraînement, l'équipe de l'Université Tsinghua a permis une détection de bout en bout sans NMS. Cette approche à double tête utilise une branche avec des assignations un-à-plusieurs pour des signaux de supervision riches pendant l'entraînement, et une autre branche avec des assignations un-à-un pour une inférence sans NMS. Ce changement architectural garantit une latence d'inférence ultra-faible et cohérente, adaptée à l'analyse vidéo haute vitesse. De plus, YOLOv10 utilise une conception de modèle axée sur l'efficacité et la précision globales, éliminant la redondance computationnelle présente dans les générations précédentes.

Impact du post-traitement

Supprimer le post-traitement NMS ne fait pas qu'accélérer l'inférence, cela simplifie considérablement le déploiement sur le matériel IA de périphérie, comme les accélérateurs IA et les NPU, où les opérations NMS personnalisées sont notoirement difficiles à compiler.

Link to this sectionComparaison des performances#

En comparant les métriques brutes sur le jeu de données MS COCO, l'écart générationnel devient évident. YOLOv10 atteint un compromis bien plus favorable entre les paramètres, les exigences computationnelles et la précision.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256,9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053,1-11.5771.3189.9

Comme indiqué ci-dessus, YOLOv10x offre un mAP supérieur de 54,4 % par rapport aux 53,1 % du YOLOv7x, tout en utilisant environ 20 % de paramètres en moins. De plus, les modèles YOLOv10 légers (Nano et Small) offrent des vitesses de déploiement TensorRT exceptionnelles, les rendant très attrayants pour le déploiement mobile.

Link to this sectionL'avantage de l'écosystème Ultralytics#

Bien que l'étude d'articles architecturaux soit instructive, le développement moderne en vision par ordinateur repose sur des frameworks robustes et bien entretenus. Choisir un modèle pris en charge par Ultralytics offre un avantage majeur pour les développeurs cherchant à passer rapidement du prototype à la production.

Link to this sectionDéveloppement rationalisé#

YOLOv10 et YOLOv7 sont tous deux accessibles via le package Python Ultralytics standard. Cela offre une facilité d'utilisation inégalée, remplaçant des milliers de lignes de code répétitif par une API simple et intuitive. De plus, les modèles Ultralytics YOLO nécessitent beaucoup moins de mémoire CUDA pendant l'entraînement par rapport aux architectures Transformer lourdes, permettant l'utilisation de tailles de batch plus grandes sur du matériel grand public.

Link to this sectionPolyvalence inégalée#

Alors que les anciens dépôts se concentrent souvent strictement sur la détection par boîte englobante (BBox), le framework intégré Ultralytics prend en charge de manière transparente une grande variété de tâches. Que tu effectues une segmentation d'instance, une estimation de pose ou une détection de boîte englobante orientée (OBB), le flux de travail reste identique.

Link to this sectionExemple de code : Flux de travail d'entraînement cohérents#

L'extrait de code suivant démontre le processus d'entraînement transparent, qui gère automatiquement l'augmentation de données et la planification du taux d'apprentissage :

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Link to this sectionCas d'utilisation et recommandations#

Le choix entre YOLOv10 et YOLOv7 dépend des exigences spécifiques de ton projet, des contraintes de déploiement et des préférences en matière d'écosystème.

Link to this sectionQuand choisir YOLOv10#

YOLOv10 est un choix solide pour :

  • Détection temps réel sans NMS : Applications bénéficiant d'une détection de bout en bout sans NMS (Non-Maximum Suppression), ce qui réduit la complexité du déploiement.
  • Compromis vitesse-précision équilibré : Projets nécessitant un bon équilibre entre la vitesse d'inférence et la précision de détection pour différentes tailles de modèles.
  • Applications à latence constante : Scénarios de déploiement où des temps d'inférence prévisibles sont essentiels, comme dans la robotique ou les systèmes autonomes.

Link to this sectionQuand choisir YOLOv7#

YOLOv7 est recommandé pour :

  • Benchmarking académique : reproduire les résultats de pointe de 2022 ou étudier les effets des techniques E-ELAN et des bag-of-freebies entraînables.
  • Recherche sur la reparamétrisation : étudier les convolutions reparamétrées planifiées et les stratégies de mise à l'échelle de modèle composée.
  • Pipelines personnalisés existants : projets avec des pipelines fortement personnalisés construits autour de l'architecture spécifique de YOLOv7 qui ne peuvent pas être facilement refactorisés.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionLa nouvelle norme : Présentation de YOLO26#

Bien que YOLOv10 ait représenté un bond en avant massif en 2024, le paysage de la vision par ordinateur évolue incroyablement vite. Pour tout nouveau développement, nous recommandons vivement le modèle de dernière génération : Ultralytics YOLO26. Lancé en janvier 2026, il représente le summum absolu de l'IA de vision en temps réel, remplaçant largement à la fois YOLOv7 et YOLOv10.

En savoir plus sur YOLO26

YOLO26 apporte des innovations sans précédent conçues spécifiquement pour les environnements de déploiement modernes :

  • Conception de bout en bout sans NMS : En s'appuyant sur les bases posées par YOLOv10, YOLO26 élimine nativement le post-traitement NMS pour des pipelines de déploiement plus simples et une inférence haute vitesse cohérente.
  • Inférence CPU jusqu'à 43 % plus rapide : Fortement optimisé pour l'Edge Computing et les appareils dépourvus de GPU dédiés, offrant des économies massives sur les coûts matériels.
  • Suppression de DFL : La perte DFL (Distribution Focal Loss) a été entièrement supprimée, ce qui simplifie radicalement la logique d'exportation et améliore considérablement la compatibilité avec les appareils de périphérie basse consommation et les microcontrôleurs.
  • Optimiseur MuSGD : Inspiré par le Kimi K2 de Moonshot AI, cet hybride de SGD et de Muon apporte les innovations d'entraînement des modèles de langage étendu (LLM) directement dans la vision par ordinateur, offrant des dynamiques d'entraînement incroyablement stables et une convergence plus rapide.
  • ProgLoss + STAL : Ces fonctions de perte avancées offrent des améliorations notables dans la reconnaissance d'objets de petite taille, un domaine historiquement difficile qui est crucial pour les drones, la robotique et la surveillance intelligente des villes.
  • Améliorations spécifiques aux tâches : YOLO26 n'est pas juste un détecteur. Il inclut une perte de segmentation sémantique spécialisée, l'estimation de la log-vraisemblance résiduelle (RLE) pour un suivi de pose ultra-précis, et des algorithmes de perte d'angle spécialisés pour éliminer les problèmes de limites OBB.
Gestion des jeux de données et entraînement

Pour la meilleure expérience possible dans la gestion de tes jeux de données, l'entraînement de YOLO26 et le déploiement de modèles dans le cloud, explore la plateforme Ultralytics. Elle offre une interface sans code qui complète parfaitement le SDK Python.

Link to this sectionCas d'utilisation réels#

La sélection de la bonne architecture dépend fortement de ton matériel et de tes contraintes d'application.

Link to this sectionQuand utiliser YOLOv7#

YOLOv7 reste un choix fiable pour maintenir les pipelines hérités qui sont déjà profondément intégrés à ses structures de tenseurs spécifiques ou lors de la reproduction de benchmarks universitaires de 2022 et 2023. Il fonctionne admirablement bien sur les GPU de serveurs haut de gamme.

Link to this sectionQuand utiliser YOLOv10#

YOLOv10 brille dans les scénarios nécessitant une latence stricte et immuable. Comme il est sans NMS, il est excellent pour le comptage de foules à haute densité ou la détection de défauts de fabrication où le nombre d'objets fluctue énormément mais où le temps de traitement par image doit rester constant.

Link to this sectionQuand utiliser YOLO26#

YOLO26 est le choix définitif pour tout nouveau projet. Du déploiement de systèmes d'alarme de sécurité sophistiqués sur un Raspberry Pi de base à l'exécution d'analyses vidéo massives basées sur le cloud, ses vitesses CPU supérieures et sa détection avancée des petits objets le rendent largement supérieur aux générations précédentes.

Pour les développeurs souhaitant explorer des architectures modernes alternatives, nous fournissons également une prise en charge étendue pour les détecteurs basés sur Transformer comme RT-DETR et les piliers générationnels précédents comme Ultralytics YOLO11.

Commentaires