Vai al contenuto

Dataset MNIST

Il dataset MNIST (Modified National Institute of Standards and Technology) è un ampio database di cifre scritte a mano, comunemente utilizzato per l'addestramento di vari sistemi di elaborazione delle immagini e modelli di machine learning. È stato creato "rimiscelando" i campioni dei dataset originali del NIST ed è diventato un benchmark per la valutazione delle prestazioni degli algoritmi di classificazione delle immagini.

Caratteristiche principali

  • MNIST contiene 60.000 immagini di training e 10.000 immagini di test di cifre scritte a mano.
  • Il dataset comprende immagini in scala di grigi di dimensioni 28×28 pixel.
  • Le immagini sono normalizzate per adattarsi a un riquadro di delimitazione di 28×28 pixel e anti-aliased, introducendo livelli di grigio.
  • MNIST è ampiamente utilizzato per il training e il testing nel campo del machine learning, specialmente per le attività di classificazione delle immagini.

Struttura del set di dati

Il dataset MNIST è suddiviso in due sottoinsiemi:

  1. Set di addestramento: Questo sottoinsieme contiene 60.000 immagini di cifre scritte a mano utilizzate per l'addestramento di modelli di machine learning.
  2. Set di test: Questo sottoinsieme è costituito da 10.000 immagini utilizzate per testare e valutare i modelli addestrati.

Accesso al Dataset

  • File originali: Scarica gli archivi gzip dalla pagina MNIST di Yann LeCun se desideri il controllo diretto sulla preelaborazione.
  • Caricatore Ultralytics: Usa data="mnist" (o data="mnist160" per il sottoinsieme sottostante) nel comando e il set di dati verrà scaricato, convertito in PNG e memorizzato automaticamente nella cache.

Ogni immagine nel dataset è etichettata con la cifra corrispondente (0-9), rendendolo un dataset di apprendimento supervisionato ideale per attività di classificazione.

Extended MNIST (EMNIST)

Extended MNIST (EMNIST) è un dataset più recente sviluppato e rilasciato da NIST per essere il successore di MNIST. Mentre MNIST includeva solo immagini di cifre scritte a mano, EMNIST include tutte le immagini del NIST Special Database 19, che è un ampio database di lettere maiuscole e minuscole scritte a mano, nonché cifre. Le immagini in EMNIST sono state convertite nello stesso formato di 28×28 pixel, con lo stesso processo, delle immagini MNIST. Di conseguenza, gli strumenti che funzionano con il dataset MNIST più vecchio e più piccolo probabilmente funzioneranno senza modifiche con EMNIST.

Applicazioni

Il dataset MNIST è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di machine learning. Il formato semplice e ben strutturato del dataset lo rende una risorsa essenziale per ricercatori e professionisti nel campo del machine learning e della computer vision.

Alcune applicazioni comuni includono:

  • Benchmarking di nuovi algoritmi di classificazione
  • Scopi didattici per l'insegnamento dei concetti di machine learning
  • Prototipazione di sistemi di riconoscimento delle immagini
  • Test delle tecniche di ottimizzazione del modello

Utilizzo

Per addestrare un modello CNN sul dataset MNIST per 100 epoche con una dimensione dell'immagine di 28×28, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di Training del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Immagini di esempio e annotazioni

Il dataset MNIST contiene immagini in scala di grigi di cifre scritte a mano, fornendo un dataset ben strutturato per attività di classificazione delle immagini. Ecco alcuni esempi di immagini dal dataset:

Immagine di esempio del set di dati

L'esempio mostra la varietà e la complessità delle cifre scritte a mano nel dataset MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di classificazione delle immagini robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset MNIST nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Desideriamo ringraziare Yann LeCun, Corinna Cortes e Christopher J.C. Burges per aver creato e mantenuto il dataset MNIST come risorsa preziosa per la comunità di ricerca nel machine learning e nella computer vision. Per maggiori informazioni sul dataset MNIST e sui suoi creatori, visitare il sito web del dataset MNIST.

Test rapidi MNIST160

Hai bisogno di un test di regressione velocissimo? Ultralytics espone anche data="mnist160", una porzione di 160 immagini contenente i primi otto campioni di ogni classe di cifre. Rispecchia la struttura della directory MNIST, quindi puoi scambiare i set di dati senza modificare altri argomenti:

Esempio di addestramento con MNIST160

yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=5 imgsz=28

Usa questo sottoinsieme per pipeline CI o controlli di integrità prima di effettuare il commit all'intero set di dati di 70.000 immagini.

FAQ

Cos'è il dataset MNIST e perché è importante nel machine learning?

Il dataset MNIST, o dataset Modified National Institute of Standards and Technology, è una raccolta ampiamente utilizzata di cifre scritte a mano progettata per l'addestramento e il test di sistemi di classificazione delle immagini. Include 60.000 immagini di addestramento e 10.000 immagini di test, tutte in scala di grigi e di dimensioni 28×28 pixel. L'importanza del dataset risiede nel suo ruolo di benchmark standard per la valutazione degli algoritmi di classificazione delle immagini, aiutando ricercatori e ingegneri a confrontare i metodi e a monitorare i progressi nel settore.

Come posso usare Ultralytics YOLO per addestrare un modello sul dataset MNIST?

Per addestrare un modello sul dataset MNIST utilizzando Ultralytics YOLO, puoi seguire questi passaggi:

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Per un elenco dettagliato degli argomenti di training disponibili, consultare la pagina Training.

Qual è la differenza tra i dataset MNIST ed EMNIST?

Il dataset MNIST contiene solo cifre scritte a mano, mentre il dataset Extended MNIST (EMNIST) include sia cifre che lettere maiuscole e minuscole. EMNIST è stato sviluppato come successore di MNIST e utilizza lo stesso formato di immagine di 28×28 pixel, rendendolo compatibile con strumenti e modelli progettati per il dataset MNIST originale. Questa gamma più ampia di caratteri in EMNIST lo rende utile per una più ampia varietà di applicazioni di machine learning.

Posso utilizzare Ultralytics HUB per addestrare modelli su set di dati personalizzati come MNIST?

Sì, puoi utilizzare Ultralytics HUB per addestrare modelli su dataset personalizzati come MNIST. Ultralytics HUB offre un'interfaccia user-friendly per caricare dataset, addestrare modelli e gestire progetti senza la necessità di ampie conoscenze di programmazione. Per maggiori dettagli su come iniziare, consulta la pagina Ultralytics HUB Quickstart.

Come si confronta MNIST con altri dataset di classificazione delle immagini?

MNIST è più semplice di molti dataset moderni come CIFAR-10 o ImageNet, il che lo rende ideale per i principianti e per una rapida sperimentazione. Mentre i dataset più complessi offrono maggiori sfide con immagini a colori e diverse categorie di oggetti, MNIST rimane prezioso per la sua semplicità, le dimensioni ridotte dei file e il significato storico nello sviluppo di algoritmi di machine learning. Per attività di classificazione più avanzate, considera l'utilizzo di Fashion-MNIST, che mantiene la stessa struttura ma presenta articoli di abbigliamento invece di cifre.



📅C reato 2 anni fa ✏️ Aggiornato 25 giorni fa
glenn-jocherpderrengerUltralyticsAssistantMatthewNoycejk4e

Commenti