Skip to content

Comparaison technique : YOLOX vs YOLOv6-3.0 pour la détection d'objets

Le choix du bon modèle de détection d'objets est crucial pour les projets de vision par ordinateur. Cette page présente une comparaison technique entre deux modèles populaires et efficaces : YOLOX et YOLOv6-3.0. Nous examinerons leurs différences architecturales, leurs performances et les applications appropriées afin de vous aider à prendre une décision éclairée.

Avant d'entrer dans le vif du sujet, donnons un aperçu des performances de ces deux modèles par rapport à d'autres :

YOLOX : L'excellence sans ancrage

YOLOX, présenté par Megvii(Zheng Ge, Songtao Liu, Feng Wang, Zeming Li et Jian Sun - 2021-07-18), se distingue par sa conception sans ancrage, qui simplifie la complexité associée aux modèles YOLO traditionnels. Il vise à combler le fossé entre la recherche et les applications industrielles grâce à ses capacités de détection d'objets efficaces et précises.

Architecture et caractéristiques principales

YOLOX adopte une approche rationalisée en éliminant les boîtes d'ancrage, ce qui simplifie le processus d'apprentissage et réduit le nombre d'hyperparamètres. Les principales innovations architecturales sont les suivantes

  • Détection sans ancrage : Supprime le besoin d'ancres prédéfinies, réduit la complexité de la conception et améliore la généralisation, ce qui permet de s'adapter à différentes tailles d'objets et à différents rapports d'aspect.
  • Tête découplée : sépare les tâches de classification et de localisation en branches distinctes, ce qui permet d'améliorer les performances, notamment en termes de précision.
  • Attribution d'étiquettes SimOTA : Utilise la stratégie avancée d'attribution des étiquettes SimOTA, qui assigne dynamiquement les cibles sur la base des résultats prédits eux-mêmes, améliorant ainsi l'efficacité et la précision de la formation.
  • Entraînement de précision mixte : Exploite la précision mixte pour accélérer à la fois la formation et l'inférence, optimisant ainsi l'efficacité des calculs.

Mesures de performance

Les modèles YOLOX atteignent une précision de pointe parmi les détecteurs d'objets en temps réel tout en conservant des vitesses d'inférence compétitives. Le tableau de comparaison ci-dessous présente des mesures détaillées.

Cas d'utilisation

  • Applications exigeantes de haute précision : Idéal pour les scénarios où la précision est primordiale, comme l'analyse d'images médicales ou d'images satellites, où l'absence d'objets critiques peut avoir des conséquences importantes.
  • Recherche et développement : Grâce à sa structure claire et simplifiée, YOLOX est bien adapté à la recherche et au développement de méthodologies de détection d'objets.
  • Tâches de détection d'objets polyvalentes : Applicable à un large éventail de tâches de détection d'objets, de la recherche universitaire au déploiement industriel, grâce à sa conception robuste et à sa grande précision.

Forces et faiblesses

Points forts :

  • Haute précision : Atteint d'excellents scores mAP, ce qui le rend adapté aux applications nécessitant une détection précise des objets.
  • Conception sans ancrage : Simplifie l'architecture, réduit les hyperparamètres et facilite la mise en œuvre.
  • Polyvalence : Adaptation à un large éventail de tâches de détection d'objets.

Faiblesses :

  • Vitesse d'inférence : Peut être légèrement plus lent que les modèles hautement optimisés comme YOLOv6-3.0, en particulier sur les appareils périphériques.
  • Taille du modèle : Certaines variantes plus importantes peuvent avoir des tailles de modèle considérables, ce qui peut être un problème pour les déploiements à ressources limitées.

En savoir plus sur YOLOX

YOLOv6-3.0 : Optimisé pour la vitesse et l'efficacité

YOLOv6-3.0, développé par Meituan(Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, et Xiangxiang Chu - 2023-01-13), est conçu pour l'inférence à grande vitesse et l'efficacité, ciblant particulièrement les applications industrielles et le déploiement en périphérie. La version 3.0 représente une mise à jour significative qui se concentre sur l'amélioration de la vitesse et de la précision.

Architecture et caractéristiques principales

YOLOv6-3.0 donne la priorité à la vitesse d'inférence grâce à des optimisations architecturales sans compromettre de manière significative la précision. Les principales caractéristiques sont les suivantes :

  • Un squelette de reparamétrage efficace : Utilise une épine dorsale reparamétrée pour accélérer la vitesse d'inférence en fusionnant les couches de convolution et de normalisation par lots.
  • Bloc hybride : Utilise une conception de bloc de réseau hybride qui équilibre la précision et l'efficacité, en optimisant les performances sur diverses plates-formes matérielles.
  • Conception de réseaux neuronaux tenant compte du matériel : Il est conçu en tenant compte de l'efficacité matérielle, ce qui le rend particulièrement adapté au déploiement sur des appareils à ressources limitées tels que Raspberry Pi et NVIDIA Jetson.
  • Stratégie de formation optimisée : Incorpore des techniques de formation affinées pour améliorer la convergence et les performances globales.

Mesures de performance

YOLOv6-3.0 excelle dans la vitesse d'inférence, atteignant des FPS (images par seconde) remarquables tout en maintenant des scores mAP compétitifs. Consultez le tableau ci-dessous pour obtenir des informations détaillées sur les performances.

Cas d'utilisation

  • Détection d'objets en temps réel : Idéal pour les applications où une faible latence et un traitement rapide sont essentiels, comme les systèmes d'alarme de sécurité, la vente au détail intelligente et les véhicules autonomes.
  • Déploiement sur des appareils périphériques : Optimisé pour être déployé sur des appareils périphériques disposant de ressources informatiques limitées, grâce à sa conception efficace et à la taille réduite des modèles.
  • Applications industrielles : Adapté aux applications industrielles pratiques et réelles nécessitant une détection rapide et efficace des objets dans les domaines de la fabrication, de la surveillance et de l'automatisation.

Forces et faiblesses

Points forts :

  • Vitesse d'inférence élevée : excellente vitesse, idéale pour les tâches de détection d'objets en temps réel.
  • Conception efficace : Les modèles plus petits et l'architecture optimisée sont parfaits pour les appareils à ressources limitées.
  • Objectif industriel : Spécialement conçu pour les applications pratiques dans les industries nécessitant une détection rapide et efficace des objets.

Faiblesses :

  • Compromis de précision : la précision peut être légèrement inférieure à celle de modèles tels que YOLOX, en particulier sur des ensembles de données complexes où la précision est largement prioritaire par rapport à la vitesse.
  • Flexibilité : Peut-être moins adaptable à des tâches de recherche hautement spécialisées que les architectures plus souples conçues pour des applications de recherche plus larges.

En savoir plus sur YOLOv6-3.0

Tableau de comparaison des modèles

Modèle taille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7

Conclusion

YOLOX et YOLOv6-3.0 sont tous deux de puissants détecteurs d'objets à un étage, chacun répondant à des priorités différentes. YOLOX excelle par sa précision et sa simplicité architecturale, ce qui en fait un choix judicieux pour la recherche et les applications exigeant une grande précision. YOLOv6-3.0 privilégie la vitesse et l'efficacité, ce qui le rend particulièrement adapté aux applications industrielles en temps réel et aux déploiements en périphérie.

Pour les utilisateurs qui recherchent d'autres options, Ultralytics propose une gamme de modèles de pointe. Envisagez d'explorer Ultralytics YOLOv8 pour un équilibre entre performance et flexibilité, YOLOv10 comme dernière itération en matière de détection en temps réel, ou encore YOLO11 pour des fonctionnalités de pointe. Ou encore, pour les applications en temps réel, RT-DETR constitue une architecture intéressante à étudier.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires