Ensemble de données Fashion-MNIST

L'ensemble de données Fashion-MNIST est une base de données d'images d'articles Zalando, composée d'un ensemble d'apprentissage de 60 000 exemples et d'un ensemble de test de 10 000 exemples. Chaque exemple est une image en niveaux de gris de 28x28, associée à une étiquette parmi 10 classes. Fashion-MNIST est destiné à remplacer directement l'ensemble de données MNIST original pour l'évaluation des algorithmes d'apprentissage automatique.

Regarde : Comment faire de la classification d'images sur l'ensemble de données MNIST de la mode à l'aide de Ultralytics YOLOv8

Caractéristiques principales

Fashion-MNIST contient 60 000 images d'entraînement et 10 000 images de test des images d'articles de Zalando.
L'ensemble de données comprend des images en niveaux de gris d'une taille de 28x28 pixels.
Chaque pixel est associé à une valeur de pixel unique, qui indique la clarté ou l'obscurité de ce pixel, les nombres les plus élevés étant les plus sombres. Cette valeur de pixel est un nombre entier compris entre 0 et 255.
Fashion-MNIST est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles :

Ensemble d'entraînement: Ce sous-ensemble contient 60 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Étiquettes

Chaque exemple de formation et de test est affecté à l'une des étiquettes suivantes :

T-shirt/top
Pantalon
Pullover
Robe
Manteau
Sandale
Chemise
Baskets
Sac
Botte de cheville

Applications

L'ensemble de données Fashion-MNIST est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données Fashion-MNIST pendant 100 époques avec une taille d'image de 28x28, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données Fashion-MNIST contient des images en niveaux de gris des images d'articles de Zalando, ce qui constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des images de l'ensemble de données Fashion-MNIST, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

Remerciements

Si tu utilises le jeu de données Fashion-MNIST dans tes travaux de recherche ou de développement, merci de mentionner le jeu de données en faisant un lien vers le dépôt GitHub. Ce jeu de données a été mis à disposition par Zalando Research.

FAQ

Qu'est-ce que l'ensemble de données Fashion-MNIST et en quoi est-il différent de MNIST ?

L'ensemble de données Fashion-MNIST est une collection de 70 000 images d'articles de Zalando en niveaux de gris, destinée à remplacer de façon moderne l'ensemble de données MNIST original. Il sert de référence pour les modèles d'apprentissage automatique dans le cadre des tâches de classification d'images. Contrairement à MNIST, qui contient des chiffres manuscrits, Fashion-MNIST se compose d'images de 28x28 pixels classées en 10 catégories liées à la mode, telles que T-shirt/top, pantalon et botte de cheville.

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données Fashion-MNIST ?

Pour entraîner un modèle Ultralytics YOLO sur l'ensemble de données Fashion-MNIST, tu peux utiliser les commandes Python et CLI . Voici un exemple rapide pour commencer :

Exemple de train

PythonCLI

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Pour des paramètres de formation plus détaillés, reporte-toi à la page Formation.

Pourquoi devrais-je utiliser l'ensemble de données Fashion-MNIST pour comparer mes modèles d'apprentissage automatique ?

L'ensemble de données Fashion-MNIST est largement reconnu dans la communauté de l'apprentissage profond comme une alternative robuste à MNIST. Il offre un ensemble d'images plus complexe et plus varié, ce qui en fait un excellent choix pour l'évaluation comparative des modèles de classification d'images. La structure de l'ensemble de données, qui comprend 60 000 images d'entraînement et 10 000 images de test, chacune étiquetée avec l'une des 10 classes, le rend idéal pour évaluer les performances de différents algorithmes d'apprentissage automatique dans un contexte plus difficile.

Puis-je utiliser Ultralytics YOLO pour des tâches de classification d'images comme Fashion-MNIST ?

Oui, les modèles Ultralytics YOLO peuvent être utilisés pour des tâches de classification d'images, y compris celles impliquant l'ensemble de données Fashion-MNIST. YOLOv8 L'outil de classification d'images, par exemple, prend en charge diverses tâches de vision telles que la détection, la segmentation et la classification. Pour commencer à effectuer des tâches de classification d'images, reporte-toi à la page Classification.

Quelles sont les principales caractéristiques et la structure de l'ensemble de données Fashion-MNIST ?

L'ensemble de données Fashion-MNIST est divisé en deux sous-ensembles principaux : 60 000 images d'entraînement et 10 000 images de test. Chaque image est une image en niveaux de gris de 28x28 pixels représentant l'une des 10 classes liées à la mode. Sa simplicité et son format bien structuré en font un outil idéal pour la formation et l'évaluation des modèles dans les tâches d'apprentissage automatique et de vision par ordinateur. Pour plus de détails sur la structure de l'ensemble de données, voir la section Structure de l'ensemble de données.

Comment puis-je mentionner l'utilisation de l'ensemble de données Fashion-MNIST dans ma recherche ?

Si tu utilises l'ensemble de données Fashion-MNIST dans tes projets de recherche ou de développement, il est important de le reconnaître en créant un lien vers le dépôt GitHub. Cela permet d'attribuer les données à Zalando Research, qui a mis le jeu de données à la disposition du public.

Créé le 2023-11-12, Mis à jour le 2024-07-04
Auteurs : glenn-jocher (5), RizwanMunawar (1)