Skip to content

YOLOv4 : Détection rapide et précise des objets

Bienvenue sur la page de documentation Ultralytics pour YOLOv4, un détecteur d'objets en temps réel à la pointe de la technologie lancé en 2020 par Alexey Bochkovskiy sur https://github.com/AlexeyAB/darknet. YOLOv4 est conçu pour offrir un équilibre optimal entre vitesse et précision, ce qui en fait un excellent choix pour de nombreuses applications.

Schéma de l'architecture de YOLOv4 Schéma de l'architecture de YOLOv4. Présentation de la conception complexe du réseau de YOLOv4, y compris les composants de l'épine dorsale, du cou et de la tête, ainsi que leurs couches interconnectées pour une détection optimale des objets en temps réel.

Introduction

YOLOv4 signifie You Only Look Once version 4. Il s'agit d'un modèle de détection d'objets en temps réel développé pour répondre aux limites des versions précédentes de YOLO comme YOLOv3 et d'autres modèles de détection d'objets. Contrairement à d'autres détecteurs d'objets basés sur des réseaux neuronaux convolutionnels (CNN), YOLOv4 ne s'applique pas seulement aux systèmes de recommandation, mais aussi à la gestion de processus autonomes et à la réduction de l'apport humain. Son fonctionnement sur des unités de traitement graphique (GPU) conventionnelles permet une utilisation de masse à un prix abordable, et il est conçu pour fonctionner en temps réel sur un GPU conventionnel tout en ne nécessitant qu'un seul GPU pour l'entraînement.

L'architecture

YOLOv4 utilise plusieurs fonctions innovantes qui travaillent ensemble pour optimiser ses performances. Il s'agit notamment des connexions résiduelles pondérées (WRC), des connexions partielles par étapes croisées (CSP), de la normalisation par mini-lots croisés (CmBN), de l'auto-apprentissage inversé (SAT), de l'activation erronée, de l'augmentation des données mosaïques, de la régularisation DropBlock et de la perte CIoU. Ces caractéristiques sont combinées pour obtenir des résultats de pointe.

Un détecteur d'objets typique est composé de plusieurs parties, notamment l'entrée, la colonne vertébrale, le cou et la tête. L'épine dorsale de YOLOv4 est pré-entraînée sur ImageNet et est utilisée pour prédire les classes et les boîtes englobantes des objets. L'épine dorsale peut provenir de plusieurs modèles, notamment VGG, ResNet, ResNeXt ou DenseNet. La partie cou du détecteur est utilisée pour collecter les cartes de caractéristiques provenant de différentes étapes et comprend généralement plusieurs chemins ascendants et plusieurs chemins descendants. La partie tête est utilisée pour effectuer les détections et classifications finales des objets.

Sac de cadeaux

YOLOv4 utilise également des méthodes connues sous le nom de "bag of freebies", qui sont des techniques qui améliorent la précision du modèle pendant l'entraînement sans augmenter le coût de l'inférence. L'augmentation des données est une technique de sac de freebies couramment utilisée dans la détection d'objets, qui augmente la variabilité des images d'entrée afin d'améliorer la robustesse du modèle. Parmi les exemples d'augmentation des données, on peut citer les distorsions photométriques (ajustement de la luminosité, du contraste, de la teinte, de la saturation et du bruit d'une image) et les distorsions géométriques (ajout d'une mise à l'échelle, d'un recadrage, d'un retournement et d'une rotation aléatoires). Ces techniques permettent au modèle de mieux s'adapter à différents types d'images.

Caractéristiques et performances

YOLOv4 est conçu pour une vitesse et une précision optimales dans la détection des objets. L'architecture de YOLOv4 comprend CSPDarknet53 comme colonne vertébrale, PANet comme cou et YOLOv3 comme tête de détection. Cette conception permet à YOLOv4 d'effectuer la détection d'objets à une vitesse impressionnante, ce qui le rend adapté aux applications en temps réel. YOLOv4 excelle également en termes de précision, obtenant des résultats de pointe dans les tests de référence de détection d'objets.

Exemples d'utilisation

Au moment de la rédaction de cet article, Ultralytics ne prend actuellement pas en charge les modèles YOLOv4. Par conséquent, tout utilisateur intéressé par l'utilisation de YOLOv4 devra se référer directement au dépôt GitHub de YOLOv4 pour obtenir des instructions d'installation et d'utilisation.

Voici un bref aperçu des étapes typiques que tu pourrais suivre pour utiliser YOLOv4 :

  1. Visite le dépôt GitHub de YOLOv4 : https://github.com/AlexeyAB/darknet.

  2. Suis les instructions fournies dans le fichier README pour l'installation. Il s'agit généralement de cloner le dépôt, d'installer les dépendances nécessaires et de configurer toutes les variables d'environnement nécessaires.

  3. Une fois l'installation terminée, tu peux entraîner et utiliser le modèle conformément aux instructions d'utilisation fournies dans le référentiel. Il s'agit généralement de préparer ton jeu de données, de configurer les paramètres du modèle, d'entraîner le modèle, puis d'utiliser le modèle entraîné pour effectuer la détection d'objets.

Note que les étapes spécifiques peuvent varier en fonction de ton cas d'utilisation particulier et de l'état actuel du dépôt YOLOv4. Par conséquent, il est fortement recommandé de se référer directement aux instructions fournies dans le dépôt GitHub de YOLOv4.

Nous regrettons les inconvénients que cela peut causer et nous nous efforcerons de mettre à jour ce document avec des exemples d'utilisation pour Ultralytics une fois que la prise en charge de YOLOv4 sera mise en œuvre.

Conclusion

YOLOv4 est un modèle de détection d'objets puissant et efficace qui trouve un équilibre entre vitesse et précision. Son utilisation de caractéristiques uniques et de techniques de sac de freebies pendant la formation lui permet d'obtenir d'excellentes performances dans les tâches de détection d'objets en temps réel. YOLOv4 peut être entraîné et utilisé par toute personne disposant d'un GPU conventionnel, ce qui le rend accessible et pratique pour un large éventail d'applications.

Citations et remerciements

Nous tenons à remercier les auteurs de YOLOv4 pour leurs contributions significatives dans le domaine de la détection d'objets en temps réel :

@misc{bochkovskiy2020yolov4,
      title={YOLOv4: Optimal Speed and Accuracy of Object Detection},
      author={Alexey Bochkovskiy and Chien-Yao Wang and Hong-Yuan Mark Liao},
      year={2020},
      eprint={2004.10934},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

L'article original sur YOLOv4 peut être consulté sur arXiv. Les auteurs ont mis leur travail à la disposition du public, et la base de code est accessible sur GitHub. Nous apprécions leurs efforts pour faire avancer le domaine et rendre leur travail accessible à la communauté élargie.



Créé le 2023-11-12, Mis à jour le 2024-01-07
Auteurs : glenn-jocher (6), sergiuwaxmann (1)

Commentaires