Link to this sectionComparaison entre YOLOv6-3.0 et YOLOv9#

Le paysage de la détection d'objets en temps réel continue d'évoluer, porté par la demande de précision accrue, de latence réduite et d'une meilleure utilisation du matériel. Cette comparaison complète examine deux étapes importantes du domaine : YOLOv6-3.0, développé pour le débit industriel, et YOLOv9, qui a introduit de nouvelles architectures pour surmonter les goulots d'étranglement de l'apprentissage profond.

Bien que les deux modèles offrent des innovations architecturales uniques, les développeurs à la recherche du meilleur équilibre entre performances et simplicité de déploiement se tournent souvent vers des écosystèmes modernes. Pour ceux qui démarrent de nouveaux projets, Ultralytics YOLO26, nativement end-to-end, est le standard recommandé, offrant une précision de pointe avec une expérience de développement nettement plus simplifiée.

Link to this sectionYOLOv6-3.0 : Optimisation du débit industriel#

Développé par le département Vision AI de Meituan, YOLOv6-3.0 a été largement conçu pour un débit maximal dans les applications industrielles, en particulier sur le matériel GPU.

Auteurs : Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu et Xiangxiang Chu
Organisation : Meituan
Date : 13 janvier 2023
Arxiv : 2301.05586
GitHub : meituan/YOLOv6

Link to this sectionInnovations architecturales#

YOLOv6-3.0 a introduit plusieurs modifications clés pour améliorer la fusion des caractéristiques et l'efficacité matérielle. L'architecture intègre un module Bi-directional Concatenation (BiC) dans son neck, qui fournit des signaux de localisation plus précis. Il utilise également une stratégie Anchor-Aided Training (AAT). Cette approche combine les conseils riches de l'entraînement basé sur les ancres avec la vitesse d'inférence d'un paradigme sans ancres, offrant de meilleures performances sans ralentir le déploiement.

Le backbone est basé sur une conception EfficientRep, méticuleusement optimisée pour être compatible avec le matériel pour l'inférence GPU. Cela le rend très performant pour les scénarios de fabrication industrielle où le traitement lourd par lots est la norme.

Link to this sectionPoints forts et faiblesses#

La force principale de YOLOv6-3.0 réside dans son taux de rafraîchissement élevé sur les GPU comme le NVIDIA T4, ce qui le rend adapté aux flux de compréhension vidéo à haute densité. Cependant, sa forte dépendance à des optimisations matérielles spécifiques peut entraîner une latence sous-optimale sur les appareils de périphérie (edge) équipés uniquement de CPU. De plus, la configuration de son pipeline d'entraînement peut être complexe par rapport à des frameworks plus unifiés.

En savoir plus sur YOLOv6

Link to this sectionYOLOv9 : Programmable Gradient Information#

Sorti un an plus tard, YOLOv9 se concentre sur la résolution du problème de goulot d'étranglement de l'information inhérent aux réseaux de neurones profonds, repoussant les limites théoriques des architectures CNN.

Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
Organisation : Institute of Information Science, Academia Sinica
Date : 21 février 2024
Arxiv : 2402.13616
GitHub : WongKinYiu/yolov9

Link to this sectionInnovations architecturales#

La contribution majeure de YOLOv9 est le Programmable Gradient Information (PGI), qui garantit que les données cruciales sont conservées lorsqu'elles traversent plusieurs couches de réseau, permettant des mises à jour de poids plus fiables. Parallèlement au PGI, le modèle présente le Generalized Efficient Layer Aggregation Network (GELAN). GELAN maximise l'efficacité des paramètres, permettant à YOLOv9 d'atteindre une précision supérieure avec moins de FLOPs de calcul que de nombreux prédécesseurs.

Link to this sectionPoints forts et faiblesses#

YOLOv9 atteint un mAP (mean Average Precision) exceptionnel sur des datasets de référence comme COCO, ce qui en fait un favori pour les chercheurs donnant la priorité à la précision brute. Cependant, comme YOLOv6, il repose toujours sur le traditionnel Non-Maximum Suppression (NMS) pour le post-traitement. Cela ajoute de la latence et complique le pipeline de déploiement de modèles, surtout lors du portage vers des appareils de périphérie utilisant des formats comme ONNX ou TensorRT.

En savoir plus sur YOLOv9

Link to this sectionComparaison des performances#

Lors de la comparaison de ces modèles, il est essentiel d'examiner l'équilibre entre précision, nombre de paramètres et vitesse d'inférence.

Modèle	taille ^(pixels)	mAP^val 50-95	Vitesse ^{CPU ONNX (ms)}	Vitesse ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37,5	-	1,17	4.7	11.4
YOLOv6-3.0s	640	45,0	-	2.66	18,5	45,3
YOLOv6-3.0m	640	50,0	-	5,28	34,9	85,8
YOLOv6-3.0l	640	52,8	-	8,95	59,6	150,7

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20,0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Link to this sectionL'avantage Ultralytics : Présentation de YOLO26#

Bien que YOLOv6-3.0 et YOLOv9 offrent des architectures robustes, les environnements de production exigent un écosystème bien entretenu, de faibles besoins en mémoire et une facilité d'utilisation exceptionnelle. C'est là que la plateforme Ultralytics et des modèles comme YOLO11 et le très moderne YOLO26 excellent.

Sorti début 2026, YOLO26 redéfinit fondamentalement l'efficacité du déploiement en éliminant les goulots d'étranglement hérités.

Conception native end-to-end

YOLO26 dispose d'une conception end-to-end sans NMS, supprimant complètement le besoin de post-traitement par Non-Maximum Suppression. Cela réduit considérablement la variance de la latence d'inférence et simplifie la logique de déploiement en périphérie.

Link to this sectionInnovations clés de YOLO26#

Optimiseur MuSGD : Inspiré par l'entraînement LLM (comme le Kimi K2 de Moonshot AI), YOLO26 utilise un hybride de SGD et Muon. Cela apporte une stabilité d'entraînement inégalée et une convergence plus rapide aux tâches de vision par ordinateur.
Inférence CPU jusqu'à 43 % plus rapide : Contrairement à l'accent mis par YOLOv6 sur le GPU, YOLO26 est fortement optimisé pour les appareils de périphérie. La suppression de la Distribution Focal Loss (DFL) simplifie la tête, la rendant très compatible avec les CPU basse consommation et le matériel d'edge computing.
ProgLoss + STAL : Des fonctions de perte avancées améliorent radicalement la détection des petits objets, ce qui est essentiel pour l'imagerie aérienne et la robotique.
Polyvalence inégalée : Alors que YOLOv6 est purement un moteur de détection, YOLO26 gère de manière transparente la segmentation d'instances, la classification, l'estimation de pose et la détection par Oriented Bounding Box (OBB).

En savoir plus sur YOLO26

Link to this sectionEntraînement transparent avec Ultralytics#

L'entraînement de modèles de pointe ne devrait pas nécessiter de scripts bash complexes. L'API Python d'Ultralytics offre une expérience simplifiée avec un chargement automatique des données, une utilisation de la mémoire CUDA minimale et un suivi intégré.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to ONNX with a single command
model.export(format="onnx")

Link to this sectionCas d'utilisation idéaux#

Le choix de la bonne architecture dépend entièrement de ton environnement de déploiement cible :

Utilise YOLOv6-3.0 pour : L'automatisation en usine et la détection de défauts où les GPU de qualité serveur (ex. : A100) sont abondants et où le traitement par lots maximise le débit.
Utilise YOLOv9 pour : La recherche académique ou les compétitions où obtenir le mAP le plus élevé possible sur des datasets standardisés comme COCO est l'objectif principal.
Use YOLO26 for: Almost all modern commercial applications. Its NMS-free architecture, low memory footprint, and high-speed CPU inference make it perfect for security alarm systems, smart retail, and real-time object tracking on embedded devices.

En tirant parti de l'écosystème Ultralytics complet, les développeurs peuvent facilement expérimenter avec YOLOv8, YOLO11 et YOLO26 pour trouver l'équilibre de performance parfait pour leurs défis concrets spécifiques.

Contributeurs

GLglenn-jocher¹³

Créé 27 janv. 2025Mis à jour il y a 3 semaines

Link to this sectionComparaison entre YOLOv6-3.0 et YOLOv9#

Link to this sectionYOLOv6-3.0 : Optimisation du débit industriel#

Link to this sectionInnovations architecturales#

Link to this sectionPoints forts et faiblesses#

Link to this sectionYOLOv9 : Programmable Gradient Information#

Link to this sectionInnovations architecturales#

Link to this sectionPoints forts et faiblesses#

Link to this sectionComparaison des performances#

Link to this sectionL'avantage Ultralytics : Présentation de YOLO26#

Link to this sectionInnovations clés de YOLO26#

Link to this sectionEntraînement transparent avec Ultralytics#

Link to this sectionCas d'utilisation idéaux#

Commentaires