Set di dati Fashion-MNIST

Il dataset Fashion-MNIST è un database di immagini di articoli di Zalando, composto da un training set di 60.000 esempi e da un test set di 10.000 esempi. Ogni esempio è un'immagine in scala di grigi 28x28, associata a un'etichetta di 10 classi. Fashion-MNIST è destinato a sostituire direttamente il dataset MNIST originale per il benchmarking degli algoritmi di apprendimento automatico.

Guarda: Come effettuare la classificazione di immagini su un dataset MNIST Moda utilizzando Ultralytics YOLOv8

Caratteristiche principali

Fashion-MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di prova di articoli di Zalando.
Il set di dati comprende immagini in scala di grigi di dimensioni 28x28 pixel.
A ogni pixel è associato un singolo valore pixel che indica la luminosità o l'oscurità di quel pixel, con numeri più alti che significano più scuro. Questo valore pixel è un numero intero compreso tra 0 e 255.
Fashion-MNIST è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di classificazione delle immagini.

Struttura del set di dati

Il set di dati Fashion-MNIST è suddiviso in due sottoinsiemi:

Set di allenamento: Questo sottoinsieme contiene 60.000 immagini utilizzate per addestrare i modelli di apprendimento automatico.
Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Etichette

Ogni esempio di formazione e di prova viene assegnato a una delle seguenti etichette:

T-shirt/top
Pantaloni
Pullover
Abito
Cappotto
Sandalo
Camicia
Sneaker
Borsa
Stivaletto

Applicazioni

Il dataset Fashion-MNIST è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il formato semplice e ben strutturato del dataset lo rende una risorsa essenziale per i ricercatori e i professionisti nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello CNN sul dataset Fashion-MNIST per 100 epoche con un'immagine di dimensioni 28x28, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Immagini di esempio e annotazioni

Il dataset Fashion-MNIST contiene immagini in scala di grigi degli articoli di Zalando, fornendo un dataset ben strutturato per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità delle immagini presenti nel dataset Fashion-MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di classificazione delle immagini robusti.

Ringraziamenti

Se utilizzi il set di dati Fashion-MNIST nel tuo lavoro di ricerca o sviluppo, ti preghiamo di riconoscere il set di dati collegandoti al repository GitHub. Questo set di dati è stato reso disponibile da Zalando Research.

DOMANDE FREQUENTI

Che cos'è il dataset Fashion-MNIST e in che modo è diverso da MNIST?

Il dataset Fashion-MNIST è una raccolta di 70.000 immagini in scala di grigi di articoli di Zalando, intesa come sostituzione moderna del dataset MNIST originale. Serve come punto di riferimento per i modelli di apprendimento automatico nel contesto dei compiti di classificazione delle immagini. A differenza di MNIST, che contiene cifre scritte a mano, Fashion-MNIST è composto da immagini di 28x28 pixel categorizzate in 10 classi relative alla moda, come T-shirt/top, pantaloni e stivaletti.

Come posso addestrare un modello YOLO sul dataset Fashion-MNIST?

Per addestrare un modello Ultralytics YOLO sul dataset Fashion-MNIST, puoi utilizzare entrambi i comandi Python e CLI . Ecco un rapido esempio per iniziare:

Esempio di treno

PythonCLI

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Per i parametri di allenamento più dettagliati, consulta la pagina dell'allenamento.

Perché dovrei utilizzare il dataset Fashion-MNIST per il benchmarking dei miei modelli di apprendimento automatico?

Il dataset Fashion-MNIST è ampiamente riconosciuto nella comunità del deep learning come una solida alternativa a MNIST. Offre un insieme di immagini più complesso e vario, che lo rende una scelta eccellente per il benchmarking dei modelli di classificazione delle immagini. La struttura del dataset, che comprende 60.000 immagini di addestramento e 10.000 immagini di test, ciascuna etichettata con una delle 10 classi, lo rende ideale per valutare le prestazioni di diversi algoritmi di apprendimento automatico in un contesto più impegnativo.

Posso utilizzare Ultralytics YOLO per compiti di classificazione delle immagini come Fashion-MNIST?

Sì, i modelli di Ultralytics YOLO possono essere utilizzati per compiti di classificazione delle immagini, compresi quelli che riguardano il dataset Fashion-MNIST. YOLOv8 Il programma di classificazione delle immagini, ad esempio, supporta diverse attività di visione come il rilevamento, la segmentazione e la classificazione. Per iniziare a svolgere attività di classificazione delle immagini, consulta la pagina Classificazione.

Quali sono le caratteristiche principali e la struttura del dataset Fashion-MNIST?

Il dataset Fashion-MNIST è suddiviso in due sottoinsiemi principali: 60.000 immagini di addestramento e 10.000 immagini di test. Ogni immagine è un'immagine in scala di grigi di 28x28 pixel che rappresenta una delle 10 classi relative alla moda. La semplicità e il formato ben strutturato lo rendono ideale per l'addestramento e la valutazione di modelli nell'apprendimento automatico e nella computer vision. Per maggiori dettagli sulla struttura del dataset, consulta la sezione Struttura del dataset.

Come posso riconoscere l'uso del dataset Fashion-MNIST nella mia ricerca?

Se utilizzi il set di dati Fashion-MNIST nei tuoi progetti di ricerca o sviluppo, è importante che tu lo riconosca collegandoti al repository GitHub. Questo aiuta ad attribuire i dati a Zalando Research, che li ha resi disponibili per l'uso pubblico.

Creato 2023-11-12, Aggiornato 2024-07-04
Autori: glenn-jocher (5), RizwanMunawar (1)