Vai al contenuto

Dataset MNIST

Il dataset MNIST (Modified National Institute of Standards and Technology) è un grande database di cifre scritte a mano che viene comunemente utilizzato per addestrare diversi sistemi di elaborazione delle immagini e modelli di apprendimento automatico. È stato creato "rimescolando" i campioni dei set di dati originali del NIST ed è diventato un punto di riferimento per valutare le prestazioni degli algoritmi di classificazione delle immagini.

Caratteristiche principali

  • MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di prova di cifre scritte a mano.
  • Il set di dati comprende immagini in scala di grigi di dimensioni 28x28 pixel.
  • Le immagini vengono normalizzate per rientrare in un riquadro di delimitazione di 28x28 pixel e antialias, introducendo livelli di scala di grigi.
  • MNIST è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per le attività di classificazione delle immagini.

Struttura del set di dati

Il dataset MNIST è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 60.000 immagini di cifre scritte a mano utilizzate per addestrare i modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

MNIST esteso (EMNIST)

L'Extended MNIST (EMNIST) è un nuovo dataset sviluppato e rilasciato dal NIST come successore di MNIST. Mentre MNIST comprendeva solo immagini di cifre scritte a mano, EMNIST include tutte le immagini del NIST Special Database 19, un ampio database di lettere maiuscole e minuscole scritte a mano e di cifre. Le immagini di EMNIST sono state convertite nello stesso formato 28x28 pixel, con lo stesso processo, delle immagini di MNIST. Di conseguenza, gli strumenti che funzionano con il dataset MNIST, più vecchio e più piccolo, probabilmente funzioneranno senza modifiche con EMNIST.

Applicazioni

Il dataset MNIST è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il formato semplice e ben strutturato del dataset lo rende una risorsa essenziale per i ricercatori e i professionisti nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello CNN sul dataset MNIST per 100 epoche con un'immagine di dimensioni 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='mnist', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Immagini di esempio e annotazioni

Il dataset MNIST contiene immagini in scala di grigi di cifre scritte a mano, fornendo un dataset ben strutturato per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità delle cifre scritte a mano nel dataset MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di robusti modelli di classificazione delle immagini.

Citazioni e ringraziamenti

Se utilizzi il set di dati MNIST nel tuo

per un lavoro di ricerca o di sviluppo, si prega di citare il seguente documento:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Desideriamo ringraziare Yann LeCun, Corinna Cortes e Christopher J.C. Burges per aver creato e mantenuto il dataset MNIST come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per maggiori informazioni sul dataset MNIST e sui suoi creatori, visita il sito web del dataset MNIST.



Creato 2023-11-12, Aggiornato 2023-11-22
Autori: glenn-jocher (3)

Commenti