Skip to content

Ensemble de données Fashion-MNIST

L'ensemble de données Fashion-MNIST est une base de données d'images d'articles de Zalando, composée d'un ensemble d'apprentissage de 60 000 exemples et d'un ensemble de test de 10 000 exemples. Chaque exemple est une image en niveaux de gris de 28x28, associée à une étiquette parmi 10 classes. Fashion-MNIST est destiné à remplacer directement l'ensemble de données MNIST original pour l'évaluation des algorithmes d'apprentissage automatique.



Regarder : Comment faire Classification des images sur l'ensemble de données Fashion MNIST en utilisant Ultralytics YOLO11

Caractéristiques principales

  • Fashion-MNIST contient 60 000 images de formation et 10 000 images de test des articles de Zalando.
  • L'ensemble de données comprend des images en niveaux de gris d'une taille de 28x28 pixels.
  • Chaque pixel est associé à une valeur unique, qui indique la clarté ou l'obscurité du pixel, les valeurs les plus élevées étant les plus sombres. Cette valeur est un nombre entier compris entre 0 et 255.
  • Fashion-MNIST est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 60 000 images utilisées pour la formation des modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Étiquettes

Chaque exemple de formation et de test est affecté à l'une des étiquettes suivantes :

  1. T-shirt/top
  2. Pantalon
  3. Pullover
  4. Robe
  5. Manteau
  6. Sandale
  7. Chemise
  8. Chaussure de sport
  9. Sac
  10. Bottines

Applications

L'ensemble de données Fashion-MNIST est largement utilisé pour la formation et l'évaluation de modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données Fashion-MNIST pour 100 époques avec une taille d'image de 28x28, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données Fashion-MNIST contient des images en niveaux de gris d'articles Zalando et constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon de l'ensemble de données

L'exemple montre la variété et la complexité des images de l'ensemble de données Fashion-MNIST, soulignant l'importance d'un ensemble de données diversifié pour l'apprentissage de modèles de classification d'images robustes.

Remerciements

Si vous utilisez l'ensemble de données Fashion-MNIST dans le cadre de vos travaux de recherche ou de développement, veuillez mentionner l'ensemble de données en établissant un lien vers le dépôt GitHub. Ce jeu de données a été mis à disposition par Zalando Research.

FAQ

Qu'est-ce que l'ensemble de données Fashion-MNIST et en quoi est-il différent de MNIST ?

L'ensemble de données Fashion-MNIST est une collection de 70 000 images en niveaux de gris d'articles Zalando, destinée à remplacer de manière moderne l'ensemble de données MNIST original. Il sert de référence pour les modèles d'apprentissage automatique dans le contexte des tâches de classification d'images. Contrairement à MNIST, qui contient des chiffres manuscrits, Fashion-MNIST se compose d'images de 28x28 pixels classées en 10 catégories liées à la mode, telles que T-shirt/top, pantalon et botte de cheville.

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données Fashion-MNIST ?

Pour entraîner un modèle Ultralytics YOLO sur l'ensemble de données Fashion-MNIST, vous pouvez utiliser les commandes Python et CLI . Voici un exemple rapide pour commencer :

Exemple de train

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Pour plus de détails sur les paramètres de formation, voir la page Formation.

Pourquoi devrais-je utiliser l'ensemble de données Fashion-MNIST pour évaluer mes modèles d'apprentissage automatique ?

L'ensemble de données Fashion-MNIST est largement reconnu dans la communauté de l'apprentissage profond comme une alternative robuste à MNIST. Il offre un ensemble d'images plus complexe et plus varié, ce qui en fait un excellent choix pour l'évaluation comparative des modèles de classification d'images. La structure de l'ensemble de données, qui comprend 60 000 images d'apprentissage et 10 000 images de test, chacune étiquetée avec l'une des 10 classes, est idéale pour évaluer les performances de différents algorithmes d'apprentissage automatique dans un contexte plus difficile.

Puis-je utiliser Ultralytics YOLO pour des tâches de classification d'images comme Fashion-MNIST ?

Oui, les modèles Ultralytics YOLO peuvent être utilisés pour des tâches de classification d'images, y compris celles impliquant l'ensemble de données Fashion-MNIST. YOLO11 L'outil de classification d'images, par exemple, prend en charge diverses tâches de vision telles que la détection, la segmentation et la classification. Pour commencer à effectuer des tâches de classification d'images, consultez la page Classification.

Quelles sont les principales caractéristiques et la structure de l'ensemble de données Fashion-MNIST ?

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles principaux : 60 000 images d'apprentissage et 10 000 images de test. Chaque image est une image en niveaux de gris de 28x28 pixels représentant l'une des 10 classes liées à la mode. Sa simplicité et son format bien structuré en font un outil idéal pour l'entraînement et l'évaluation de modèles dans les domaines de l'apprentissage automatique et de la vision par ordinateur. Pour plus de détails sur la structure de l'ensemble de données, voir la section Structure de l'ensemble de données.

Comment puis-je mentionner l'utilisation de l'ensemble de données Fashion-MNIST dans ma recherche ?

Si vous utilisez l'ensemble de données Fashion-MNIST dans vos projets de recherche ou de développement, il est important de le mentionner en créant un lien vers le dépôt GitHub. Cela permet d'attribuer les données à Zalando Research, qui a mis l'ensemble de données à la disposition du public.

📅C réé il y a 1 an ✏️ Mis à jour il y a 2 mois

Commentaires