Passer au contenu

Ensemble de données Fashion-MNIST

L'ensemble de données Fashion-MNIST est une base de données d'images d'articles de Zalando, comprenant un ensemble d'entraînement de 60 000 exemples et un ensemble de test de 10 000 exemples. Chaque exemple est une image en niveaux de gris de 28x28 pixels, associée à une étiquette parmi 10 classes. Fashion-MNIST est destiné à servir de remplacement direct à l'ensemble de données MNIST original pour l'évaluation comparative des algorithmes d'apprentissage automatique.



Regarder : Comment faire Classification d'images sur l'ensemble de données Fashion MNIST en utilisant Ultralytics YOLO11

Principales caractéristiques

  • Fashion-MNIST contient 60 000 images d'entraînement et 10 000 images de test d'articles de Zalando.
  • L'ensemble de données comprend des images en niveaux de gris de taille 28x28 pixels.
  • Chaque pixel a une seule valeur de pixel associée, indiquant la clarté ou l'obscurité de ce pixel, les nombres plus élevés signifiant plus sombre. Cette valeur de pixel est un entier compris entre 0 et 255.
  • Fashion-MNIST est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure du jeu de données

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles :

  1. Ensemble d’entraînement: Ce sous-ensemble contient 60 000 images utilisées pour l’entraînement des modèles d’apprentissage automatique.
  2. Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Étiquettes

Chaque exemple d'entraînement et de test est affecté à l'une des étiquettes suivantes:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Applications

L'ensemble de données Fashion-MNIST est largement utilisé pour l'entraînement et l'évaluation de modèles d'apprentissage profond dans les tâches de classification d'images, telles que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données Fashion-MNIST pendant 100 epochs avec une taille d'image de 28x28, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Images et annotations d'exemple

L'ensemble de données Fashion-MNIST contient des images en niveaux de gris d'articles de Zalando, fournissant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images de l'ensemble de données:

Exemple d'image de l'ensemble de données

Cet exemple illustre la variété et la complexité des images dans l'ensemble de données Fashion-MNIST, soulignant l'importance d'un ensemble de données diversifié pour l'entraînement de modèles de classification d'images robustes.

Remerciements

Si vous utilisez l'ensemble de données Fashion-MNIST dans vos travaux de recherche ou de développement, veuillez mentionner l'ensemble de données en incluant un lien vers le référentiel GitHub. Cet ensemble de données a été mis à disposition par Zalando Research.

FAQ

Qu'est-ce que le jeu de données Fashion-MNIST et en quoi diffère-t-il de MNIST ?

L'ensemble de données Fashion-MNIST est une collection de 70 000 images en niveaux de gris d'articles de Zalando, conçue pour remplacer l'ensemble de données MNIST original. Il sert de référence pour les modèles d'apprentissage automatique dans le contexte des tâches de classification d'images. Contrairement à MNIST, qui contient des chiffres manuscrits, Fashion-MNIST se compose d'images de 28x28 pixels classées en 10 catégories liées à la mode, telles que T-shirt/haut, pantalon et bottine.

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données Fashion-MNIST ?

Pour entraîner un modèle Ultralytics YOLO sur le jeu de données Fashion-MNIST, vous pouvez utiliser les commandes Python et CLI. Voici un exemple rapide pour vous aider à démarrer :

Exemple d'entraînement

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Pour des paramètres d'entraînement plus détaillés, consultez la page d'entraînement.

Pourquoi devrais-je utiliser l'ensemble de données Fashion-MNIST pour évaluer mes modèles d'apprentissage automatique ?

L'ensemble de données Fashion-MNIST est largement reconnu dans la communauté de l'apprentissage profond comme une alternative robuste à MNIST. Il offre un ensemble d'images plus complexe et varié, ce qui en fait un excellent choix pour l'évaluation comparative des modèles de classification d'images. La structure de l'ensemble de données, comprenant 60 000 images d'entraînement et 10 000 images de test, chacune étiquetée avec l'une des 10 classes, le rend idéal pour évaluer les performances de différents algorithmes d'apprentissage automatique dans un contexte plus stimulant.

Puis-je utiliser Ultralytics YOLO pour des tâches de classification d'images comme Fashion-MNIST ?

Oui, les modèles Ultralytics YOLO peuvent être utilisés pour des tâches de classification d'images, y compris celles impliquant l'ensemble de données Fashion-MNIST. YOLO11, par exemple, prend en charge diverses tâches de vision telles que la détection, la segmentation et la classification. Pour commencer avec les tâches de classification d'images, consultez la page Classification.

Quelles sont les principales caractéristiques et la structure du jeu de données Fashion-MNIST ?

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles principaux : 60 000 images d'entraînement et 10 000 images de test. Chaque image est une image en niveaux de gris de 28x28 pixels représentant l'une des 10 classes liées à la mode. La simplicité et le format bien structuré le rendent idéal pour l'entraînement et l'évaluation de modèles dans les tâches d'apprentissage automatique et de vision par ordinateur. Pour plus de détails sur la structure de l'ensemble de données, consultez la section Structure de l'ensemble de données.

Comment puis-je mentionner l'utilisation de l'ensemble de données Fashion-MNIST dans mes recherches ?

Si vous utilisez l'ensemble de données Fashion-MNIST dans vos projets de recherche ou de développement, il est important de le mentionner en incluant un lien vers le référentiel GitHub. Cela permet d'attribuer les données à Zalando Research, qui a mis l'ensemble de données à disposition pour un usage public.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 8 mois

Commentaires