Skip to content

Ensemble de données Fashion-MNIST

L'ensemble de données Fashion-MNIST est une base de données d'images d'articles Zalando, composée d'un ensemble d'apprentissage de 60 000 exemples et d'un ensemble de test de 10 000 exemples. Chaque exemple est une image en niveaux de gris de 28x28, associée à une étiquette parmi 10 classes. Fashion-MNIST est destiné à remplacer directement l'ensemble de données MNIST original pour l'évaluation des algorithmes d'apprentissage automatique.

Caractéristiques principales

  • Fashion-MNIST contient 60 000 images d'entraînement et 10 000 images de test des images d'articles de Zalando.
  • L'ensemble de données comprend des images en niveaux de gris d'une taille de 28x28 pixels.
  • Chaque pixel est associé à une valeur de pixel unique, qui indique la clarté ou l'obscurité de ce pixel, les nombres les plus élevés étant les plus sombres. Cette valeur de pixel est un nombre entier compris entre 0 et 255.
  • Fashion-MNIST est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 60 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Étiquettes

Chaque exemple de formation et de test est affecté à l'une des étiquettes suivantes :

  1. T-shirt/top
  2. Pantalon
  3. Pullover
  4. Robe
  5. Manteau
  6. Sandale
  7. Chemise
  8. Baskets
  9. Sac
  10. Botte de cheville

Applications

L'ensemble de données Fashion-MNIST est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données Fashion-MNIST pendant 100 époques avec une taille d'image de 28x28, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='fashion-mnist', epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données Fashion-MNIST contient des images en niveaux de gris des images d'articles de Zalando, ce qui constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des images de l'ensemble de données Fashion-MNIST, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

Remerciements

Si tu utilises le jeu de données Fashion-MNIST dans tes travaux de recherche ou de développement, merci de citer le jeu de données en faisant un lien vers le dépôt GitHub. Ce jeu de données a été mis à disposition par Zalando Research.



Créé le 2023-11-12, Mis à jour le 2023-11-18
Auteurs : glenn-jocher (2)

Commentaires