Skip to content

Ensemble de données ImageWoof

L'ensemble de données ImageWoof est un sous-ensemble d'ImageNet composé de 10 classes difficiles à classer, puisqu'il s'agit de races de chiens. Il a été créé comme une tâche plus difficile à résoudre pour les algorithmes de classification d'images, dans le but d'encourager le développement de modèles plus avancés.

Caractéristiques principales

  • ImageWoof contient des images de 10 races de chiens diffĂ©rentes : Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever, et Old English sheepdog.
  • L'ensemble de donnĂ©es fournit des images Ă  diffĂ©rentes rĂ©solutions (pleine taille, 320px, 160px), s'adaptant ainsi aux diffĂ©rentes capacitĂ©s de calcul et aux besoins de la recherche.
  • Il comprend Ă©galement une version avec des Ă©tiquettes bruyantes, offrant un scĂ©nario plus rĂ©aliste oĂą les Ă©tiquettes ne sont pas toujours fiables.

Structure de l'ensemble de données

La structure de l'ensemble de données ImageWoof est basée sur les classes de races de chiens, chaque race ayant son propre répertoire d'images.

Applications

L'ensemble de données ImageWoof est largement utilisé pour former et évaluer les modèles d'apprentissage profond dans les tâches de classification d'images, en particulier lorsqu'il s'agit de classes plus complexes et similaires. Le défi de l'ensemble de données réside dans les différences subtiles entre les races de chiens, repoussant les limites de la performance et de la généralisation du modèle.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données ImageWoof pendant 100 époques avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Variantes du jeu de données

L'ensemble de données ImageWoof est disponible en trois tailles différentes pour répondre à divers besoins de recherche et capacités de calcul :

  1. Taille réelle (imagewoof): Il s'agit de la version originale de l'ensemble de données ImageWoof. Il contient des images de taille réelle et est idéal pour l'entraînement final et l'évaluation comparative des performances.

  2. Taille moyenne (imagewoof320): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 320 pixels. Elle convient pour un entraînement plus rapide sans sacrifier de manière significative les performances du modèle.

  3. Petite taille (imagewoof160): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 160 pixels. Elle est conçue pour le prototypage rapide et l'expérimentation où la vitesse d'apprentissage est une priorité.

Pour utiliser ces variantes dans ton apprentissage, remplace simplement "imagewoof" dans l'argument du jeu de données par "imagewoof320" ou "imagewoof160". Par exemple :

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Il est important de noter que l'utilisation d'images plus petites entraînera probablement des performances moindres en termes de précision de la classification. Cependant, c'est un excellent moyen d'itérer rapidement dans les premières étapes du développement du modèle et du prototypage.

Exemples d'images et d'annotations

L'ensemble de données ImageWoof contient des images colorées de différentes races de chiens, ce qui constitue un ensemble de données stimulant pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente les différences et les similitudes subtiles entre les différentes races de chiens de l'ensemble de données ImageWoof, soulignant la complexité et la difficulté de la tâche de classification.

Citations et remerciements

Si tu utilises le jeu de données ImageWoof dans tes travaux de recherche ou de développement, assure-toi de reconnaître les créateurs du jeu de données en établissant un lien vers le dépôt officiel du jeu de données.

Nous tenons à remercier l'équipe FastAI pour la création et la maintenance de l'ensemble de données ImageWoof, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données ImageWoof, visite le référentiel de l'ensemble de données ImageWoof.

FAQ

Qu'est-ce que l'ensemble de données ImageWoof dans Ultralytics?

L'ensemble de données ImageWoof est un sous-ensemble difficile d'ImageNet qui se concentre sur 10 races de chiens spécifiques. Créé pour repousser les limites des modèles de classification d'images, il présente des races comme le Beagle, le Shih-Tzu et le Golden Retriever. L'ensemble de données comprend des images de différentes résolutions (pleine taille, 320px, 160px) et même des étiquettes bruitées pour des scénarios d'entraînement plus réalistes. Cette complexité fait d'ImageWoof un outil idéal pour développer des modèles d'apprentissage profond plus avancés.

Comment puis-je former un modèle en utilisant l'ensemble de données ImageWoof avec Ultralytics YOLO ?

Pour entraîner un modèle de réseau neuronal convolutif (CNN) sur l'ensemble de données ImageWoof en utilisant Ultralytics YOLO pour 100 époques à une taille d'image de 224x224, tu peux utiliser le code suivant :

Exemple de train

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Pour plus de détails sur les arguments de formation disponibles, reporte-toi à la page Formation.

Quelles sont les versions du jeu de données ImageWoof disponibles ?

L'ensemble de données ImageWoof est disponible en trois tailles :

  1. Taille réelle (imagewoof): Idéal pour la formation finale et l'analyse comparative, contenant des images en taille réelle.
  2. Taille moyenne (imagewoof320): Images redimensionnées avec une longueur de bord maximale de 320 pixels, adaptées à un entraînement plus rapide.
  3. Petite taille (imagewoof160): Images redimensionnées avec une longueur de bord maximale de 160 pixels, parfaites pour le prototypage rapide.

Utilise ces versions en remplaçant 'imagewoof' dans l'argument dataset en conséquence. Note cependant que les images plus petites peuvent donner une classification moins précise, mais peuvent être utiles pour des itérations plus rapides.

En quoi les étiquettes bruyantes de l'ensemble de données ImageWoof sont-elles utiles à la formation ?

Les étiquettes bruitées de l'ensemble de données ImageWoof simulent des conditions réelles où les étiquettes ne sont pas toujours exactes. L'entraînement des modèles avec ces données permet de développer la robustesse et la généralisation dans les tâches de classification d'images. Cela prépare les modèles à traiter efficacement les données ambiguës ou mal étiquetées, que l'on rencontre souvent dans les applications pratiques.

Quels sont les principaux défis liés à l'utilisation de l'ensemble de données ImageWoof ?

Le principal défi de l'ensemble de données ImageWoof réside dans les différences subtiles entre les races de chiens qu'il inclut. Comme il se concentre sur 10 races étroitement liées, faire la distinction entre elles nécessite des modèles de classification d'images plus avancés et plus fins. Cela fait d'ImageWoof une excellente référence pour tester les capacités et les améliorations des modèles d'apprentissage profond.



Créé le 2023-11-12, Mis à jour le 2024-07-04
Auteurs : glenn-jocher (6)

Commentaires