Ensemble de données ImageWoof

Q: What versions of the ImageWoof dataset are available?

Le jeu de données ImageWoof existe en trois tailles : Utilisez ces versions en remplaçant "imagewoof" dans l'argument du jeu de données. Notez cependant que les images plus petites peuvent donner une classification moins précise, mais peuvent être utiles pour des itérations plus rapides.

L'ensemble de données ImageWoof est un sous-ensemble d'ImageNet composé de 10 classes difficiles à classer, puisqu'il s'agit de races de chiens. Il a été créé comme une tâche plus difficile à résoudre pour les algorithmes de classification d'images, dans le but d'encourager le développement de modèles plus avancés.

Caractéristiques principales

ImageWoof contient des images de 10 races de chiens différentes : Terrier australien, Border terrier, Samoyède, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever et Old English sheepdog.
L'ensemble de données fournit des images à différentes résolutions (pleine taille, 320 px, 160 px), ce qui permet de s'adapter aux différentes capacités de calcul et aux besoins de la recherche.
Il comprend également une version avec des étiquettes bruyantes, offrant un scénario plus réaliste dans lequel les étiquettes ne sont pas toujours fiables.

Structure de l'ensemble de données

La structure de l'ensemble de données ImageWoof est basée sur les classes de races de chiens, chaque race ayant son propre répertoire d'images. Comme d'autres ensembles de données de classification, il suit un format de répertoire divisé avec des dossiers distincts pour les ensembles d'entraînement et de validation.

Applications

Le jeu de données ImageWoof est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, en particulier lorsqu'il s'agit de classes plus complexes et similaires. Le défi de ce jeu de données réside dans les différences subtiles entre les races de chiens, repoussant les limites de la performance et de la généralisation des modèles. Il est particulièrement utile pour :

Évaluation comparative des performances des modèles de classification pour les catégories à granularité fine
Tester la robustesse du modèle par rapport à des classes similaires
Développer des algorithmes capables de distinguer des différences visuelles subtiles
Évaluer les capacités d'apprentissage par transfert de domaines généraux à des domaines spécifiques

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données ImageWoof pour 100 époques avec une taille d'image de 224x224, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de train

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Variantes de l'ensemble de données

Le jeu de données ImageWoof est disponible en trois tailles différentes afin de répondre aux différents besoins de la recherche et aux capacités de calcul :

Taille réelle (imagewoof): Il s'agit de la version originale de l'ensemble de données ImageWoof. Il contient des images de taille réelle et est idéal pour l'entraînement final et l'évaluation des performances.
Taille moyenne (imagewoof320): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 320 pixels. Elle convient pour un entraînement plus rapide sans sacrifier de manière significative les performances du modèle.
Petite taille (imagewoof160): Cette version contient des images redimensionnées pour avoir une longueur de bord maximale de 160 pixels. Elle est conçue pour le prototypage rapide et l'expérimentation où la vitesse d'apprentissage est une priorité.

Pour utiliser ces variantes dans votre formation, remplacez simplement "imagewoof" dans l'argument de l'ensemble de données par "imagewoof320" ou "imagewoof160". En voici un exemple :

Exemple

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Il est important de noter que l'utilisation d'images plus petites entraînera probablement des performances moindres en termes de précision de la classification. Cependant, il s'agit d'un excellent moyen d'itérer rapidement au cours des premières étapes du développement du modèle et du prototypage.

Exemples d'images et d'annotations

L'ensemble de données ImageWoof contient des images colorées de différentes races de chiens, ce qui constitue un défi pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon de l'ensemble de données

L'exemple montre les différences et les similitudes subtiles entre les différentes races de chiens dans l'ensemble de données ImageWoof, soulignant la complexité et la difficulté de la tâche de classification.

Citations et remerciements

Si vous utilisez le jeu de données ImageWoof dans le cadre de vos travaux de recherche ou de développement, veillez à remercier les créateurs du jeu de données en établissant un lien vers le dépôt officiel du jeu de données.

Nous tenons à remercier l'équipe FastAI pour la création et la maintenance de l'ensemble de données ImageWoof, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données ImageWoof, visitez le dépôt de données ImageWoof.

FAQ

Qu'est-ce que l'ensemble de données ImageWoof dans Ultralytics?

L'ensemble de données ImageWoof est un sous-ensemble difficile d'ImageNet qui se concentre sur 10 races de chiens spécifiques. Créé pour repousser les limites des modèles de classification d'images, il présente des races telles que le Beagle, le Shih-Tzu et le Golden Retriever. L'ensemble de données comprend des images de différentes résolutions (pleine taille, 320 px, 160 px) et même des étiquettes bruitées pour des scénarios d'entraînement plus réalistes. Cette complexité fait d'ImageWoof un outil idéal pour développer des modèles d'apprentissage profond plus avancés.

Comment puis-je entraîner un modèle en utilisant l'ensemble de données ImageWoof avec Ultralytics YOLO ?

Pour entraîner un modèle de réseau neuronal convolutif (CNN) sur l'ensemble de données ImageWoof en utilisant Ultralytics YOLO pour 100 époques à une taille d'image de 224x224, vous pouvez utiliser le code suivant :

Exemple de train

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Pour plus de détails sur les arguments de formation disponibles, consultez la page Formation.

Quelles sont les versions disponibles du jeu de données ImageWoof ?

L'ensemble de données ImageWoof est disponible en trois tailles :

Taille réelle (imagewoof): Idéal pour la formation finale et l'évaluation comparative, il contient des images en taille réelle.
Taille moyenne (imagewoof320): Images redimensionnées avec une longueur de bord maximale de 320 pixels, adaptées à une formation plus rapide.
Petite taille (imagewoof160): Images redimensionnées avec une longueur de bord maximale de 160 pixels, parfaites pour le prototypage rapide.

Utilisez ces versions en remplaçant "imagewoof" dans l'argument du jeu de données. Notez toutefois que les images plus petites peuvent donner une classification moins précise, mais qu'elles peuvent être utiles pour des itérations plus rapides.

En quoi les étiquettes bruitées de l'ensemble de données ImageWoof sont-elles utiles à la formation ?

Les étiquettes bruitées de l'ensemble de données ImageWoof simulent des conditions réelles dans lesquelles les étiquettes ne sont pas toujours exactes. L'entraînement des modèles avec ces données permet de développer la robustesse et la généralisation des tâches de classification d'images. Les modèles sont ainsi préparés à traiter efficacement des données ambiguës ou mal étiquetées, ce qui est souvent le cas dans les applications pratiques.

Quels sont les principaux défis liés à l'utilisation du jeu de données ImageWoof ?

Le principal défi de l'ensemble de données ImageWoof réside dans les différences subtiles entre les races de chiens qu'il inclut. Comme il se concentre sur 10 races étroitement liées, la distinction entre elles nécessite des modèles de classification d'images plus avancés et plus fins. ImageWoof est donc une excellente référence pour tester les capacités et les améliorations des modèles d'apprentissage profond.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois