Skip to content

YOLO vs. YOLOv9 : Comparaison technique détaillée

Le choix du modèle de détection d'objets optimal est essentiel pour les tâches de vision par ordinateur, car différents modèles offrent des avantages uniques en termes de précision, de vitesse et d'efficacité. Cette page propose une comparaison technique entre YOLO et YOLOv9, deux modèles avancés dans le domaine. Nous analysons leurs architectures, leurs performances et les applications appropriées pour guider votre choix de modèle.

DAMO-YOLO

YOLO est présenté par le groupe Alibaba et introduit en novembre 2022(arXiv). Il met l'accent sur l'équilibre entre la vitesse et la précision, en incorporant des backbones de recherche d'architecture neuronale (NAS) et des composants de réseau efficaces.

Architecture et caractéristiques

L'architecture de YOLO se distingue par plusieurs innovations clés :

  • NAS Backbone: Emploie un backbone optimisé par la recherche d'architecture neuronale pour une extraction efficace des caractéristiques.
  • RepGFPN: Utilise un réseau pyramidal de gradient efficace (GFPN) pour la fusion des caractéristiques.
  • ZeroHead: une tête de détection légère conçue pour réduire la charge de calcul.
  • AlignedOTA: met en œuvre l'affectation optimale de transport (OTA) alignée pour améliorer l'affectation des étiquettes pendant la formation.
  • Amélioration de la distillation: Incorpore des techniques de distillation des connaissances pour stimuler les performances.

Mesures de performance

YOLO propose différentes tailles de modèles (minuscule, petit, moyen, grand) pour répondre aux différents besoins de calcul. Les principaux indicateurs de performance sont les suivants :

  • mAP: Atteint une précision moyenne compétitive (mAP) sur des ensembles de données tels que COCO.
  • Vitesse d'inférence: Conçue pour une inférence rapide, elle convient aux tâches de détection d'objets en temps réel.
  • Taille du modèle: Disponible en différentes tailles, permettant une flexibilité de déploiement.

Forces et faiblesses

Points forts :

  • Précision et rapidité élevées: équilibre entre précision et rapidité d'inférence.
  • Architecture innovante: Incorpore des composants NAS et efficaces pour des performances optimisées.
  • Adaptabilité: Différentes tailles de modèles sont proposées pour répondre à diverses exigences en matière d'applications.

Faiblesses :

  • Complexité: L'architecture avancée peut être plus complexe à personnaliser ou à modifier que les modèles plus simples.
  • Documentation limitée: La documentation peut être moins complète que celle de modèles plus largement adoptés comme la série YOLO (README de GitHub).

Cas d'utilisation

YOLO est bien adapté aux applications nécessitant un mélange de précision et de rapidité, telles que

  • Surveillance en temps réel: Systèmes de sécurité et de surveillance pour lesquels une détection rapide est cruciale.
  • Robotique: Applications en robotique qui exigent une perception efficace et précise.
  • Inspection industrielle: Processus automatisés de contrôle de la qualité dans l'industrie manufacturière.

En savoir plus sur YOLO

YOLOv9

YOLOv9 est le dernier né de la série YOLO , présenté en février 2024(arXiv) par des chercheurs de l'Institut des sciences de l'information, Academia Sinica, Taïwan. YOLOv9 se concentre sur la perte d'informations dans les réseaux profonds afin d'améliorer à la fois la précision et l'efficacité.

Architecture et caractéristiques

YOLOv9 introduit des techniques innovantes pour surmonter les limites des modèles d'apprentissage profond :

  • Information à gradient programmable (PGI) : Une innovation clé pour préserver les informations cruciales à travers le réseau, atténuant ainsi la perte d'informations.
  • Réseau d'agrégation de couches efficace et généralisé (GELAN): Emploie GELAN pour un calcul efficace et l'utilisation des paramètres.
  • Améliorations de l'épine dorsale et de la tête de détection: Raffinement de l'épine dorsale et de la tête de détection afin d'améliorer l'extraction et la détection des caractéristiques.

Mesures de performance

YOLOv9 démontre des performances de pointe en matière de détection d'objets en temps réel :

  • mAP: Obtention de scores mAP élevés sur des ensembles de données de référence tels que COCO, surpassant les modèles précédents.
  • Vitesse d'inférence: maintient des vitesses d'inférence impressionnantes adaptées aux applications en temps réel.
  • Taille du modèle: Offre différentes tailles de modèles (minuscule, petit, moyen, etc.) avec différents nombres de paramètres et de FLOPs.

Forces et faiblesses

Points forts :

  • Précision de pointe: Précision supérieure à celle de nombreux détecteurs d'objets en temps réel.
  • Conception efficace: PGI et GELAN contribuent à une plus grande efficacité et à une réduction des frais généraux de calcul.
  • Polyvalence: Adaptation à diverses tâches de détection d'objets et à divers scénarios de déploiement.
  • Intégration d'Ultralytics : Facile à utiliser grâce aupackage Ultralytics Python et à une documentation complète.

Faiblesses :

  • Nouveau modèle: S'agissant d'un modèle récent, le soutien de la communauté et les ressources disponibles peuvent être encore en croissance par rapport à des modèles plus établis.
  • Demande de calcul: Les grands modèles YOLOv9 peuvent encore nécessiter des ressources informatiques importantes.

Cas d'utilisation

YOLOv9 est idéal pour les applications exigeant une précision de premier ordre et un traitement en temps réel :

  • Systèmes avancés d'aide à la conduite (ADAS): Voitures auto-conduites et systèmes autonomes nécessitant une détection précise des objets.
  • Analyse d'images à haute résolution: Applications bénéficiant d'une détection détaillée et précise dans les images à haute résolution, telles que l'analyse d'images satellites.
  • Automatisation industrielle: Tâches d'automatisation complexes nécessitant une précision et une fiabilité élevées.

En savoir plus sur YOLOv9

Tableau de comparaison des modèles

Modèle taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0

YOLO et YOLOv9 représentent tous deux des avancées significatives en matière de détection d'objets. YOLO offre un bon équilibre entre vitesse et précision grâce à son architecture efficace, tandis que YOLOv9 repousse les limites de la précision grâce à ses techniques innovantes PGI et GELAN. Votre choix dépendra des besoins spécifiques de votre application, qu'elle privilégie une précision de pointe ou un profil de performance bien équilibré.

Les utilisateurs pourraient également être intéressés par une comparaison de ces modèles avec d'autres variantes de YOLO telles que YOLOv8YOLOv7, YOLOv5et le YOLO11ainsi que des modèles comme YOLOX, RT-DETRet PP-YOLOE pour une exploration plus approfondie des modèles de détection d'objets.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires