Skip to content

Ensemble de données ImageWoof

L'ensemble de données ImageWoof est un sous-ensemble d'ImageNet composé de 10 classes difficiles à classer, puisqu'il s'agit de races de chiens. Il a été créé comme une tâche plus difficile à résoudre pour les algorithmes de classification d'images, dans le but d'encourager le développement de modèles plus avancés.

Caractéristiques principales

  • ImageWoof contient des images de 10 races de chiens diffĂ©rentes : Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever, et Old English sheepdog.
  • L'ensemble de donnĂ©es fournit des images Ă  diffĂ©rentes rĂ©solutions (pleine taille, 320px, 160px), s'adaptant ainsi aux diffĂ©rentes capacitĂ©s de calcul et aux besoins de la recherche.
  • Il comprend Ă©galement une version avec des Ă©tiquettes bruyantes, offrant un scĂ©nario plus rĂ©aliste oĂą les Ă©tiquettes ne sont pas toujours fiables.

Structure de l'ensemble de données

La structure de l'ensemble de données ImageWoof est basée sur les classes de races de chiens, chaque race ayant son propre répertoire d'images.

Applications

L'ensemble de données ImageWoof est largement utilisé pour former et évaluer les modèles d'apprentissage profond dans les tâches de classification d'images, en particulier lorsqu'il s'agit de classes plus complexes et similaires. Le défi de l'ensemble de données réside dans les différences subtiles entre les races de chiens, repoussant les limites de la performance et de la généralisation du modèle.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données ImageWoof pendant 100 époques avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Variantes du jeu de données

L'ensemble de données ImageWoof est disponible en trois tailles différentes pour répondre à divers besoins de recherche et capacités de calcul :

  1. Taille réelle (imagewoof): Il s'agit de la version originale de l'ensemble de données ImageWoof. Il contient des images de taille réelle et est idéal pour l'entraînement final et l'évaluation comparative des performances.

  2. Taille moyenne (imagewoof320): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 320 pixels. Elle convient pour un entraînement plus rapide sans sacrifier de manière significative les performances du modèle.

  3. Petite taille (imagewoof160): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 160 pixels. Elle est conçue pour le prototypage rapide et l'expérimentation où la vitesse d'apprentissage est une priorité.

Pour utiliser ces variantes dans ton apprentissage, remplace simplement "imagewoof" dans l'argument du jeu de données par "imagewoof320" ou "imagewoof160". Par exemple :

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

Il est important de noter que l'utilisation d'images plus petites entraînera probablement des performances moindres en termes de précision de la classification. Cependant, c'est un excellent moyen d'itérer rapidement dans les premières étapes du développement du modèle et du prototypage.

Exemples d'images et d'annotations

L'ensemble de données ImageWoof contient des images colorées de différentes races de chiens, ce qui constitue un ensemble de données stimulant pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente les différences et les similitudes subtiles entre les différentes races de chiens de l'ensemble de données ImageWoof, soulignant la complexité et la difficulté de la tâche de classification.

Citations et remerciements

Si tu utilises le jeu de données ImageWoof dans tes travaux de recherche ou de développement, assure-toi de reconnaître les créateurs du jeu de données en établissant un lien vers le dépôt officiel du jeu de données.

Nous tenons à remercier l'équipe FastAI pour la création et la maintenance de l'ensemble de données ImageWoof, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données ImageWoof, visite le référentiel de l'ensemble de données ImageWoof.



Créé le 2023-11-12, Mis à jour le 2023-12-03
Auteurs : glenn-jocher (3)

Commentaires