Set di dati MNIST
Il dataset MNIST (Modified National Institute of Standards and Technology) è un grande database di cifre scritte a mano, comunemente utilizzato per l'addestramento di vari sistemi di elaborazione delle immagini e modelli di apprendimento automatico. È stato creato "rimescolando" i campioni dei set di dati originali del NIST ed è diventato un punto di riferimento per valutare le prestazioni degli algoritmi di classificazione delle immagini.
Caratteristiche principali
- MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di test di cifre scritte a mano.
- Il set di dati comprende immagini in scala di grigi di dimensioni 28×28 pixel.
- Le immagini sono normalizzate per rientrare in un riquadro di delimitazione di 28×28 pixel e antialias, introducendo livelli di scala di grigi.
- MNIST è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di classificazione delle immagini.
Struttura del set di dati
Il dataset MNIST è suddiviso in due sottoinsiemi:
- Set di addestramento: Questo sottoinsieme contiene 60.000 immagini di cifre scritte a mano, utilizzate per l'addestramento dei modelli di apprendimento automatico.
- Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.
Ogni immagine del dataset è etichettata con la cifra corrispondente (0-9), il che lo rende un dataset di apprendimento supervisionato ideale per compiti di classificazione.
MNIST esteso (EMNIST)
L'Extended MNIST (EMNIST) è un nuovo set di dati sviluppato e rilasciato dal NIST come successore di MNIST. Mentre MNIST comprendeva solo immagini di cifre scritte a mano, EMNIST include tutte le immagini del NIST Special Database 19, un ampio database di lettere maiuscole e minuscole scritte a mano e di cifre. Le immagini di EMNIST sono state convertite nello stesso formato 28×28 pixel, con lo stesso processo, delle immagini di MNIST. Di conseguenza, gli strumenti che funzionano con il dataset MNIST, più vecchio e più piccolo, probabilmente funzioneranno senza modifiche con EMNIST.
Applicazioni
Il dataset MNIST è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione di immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il formato semplice e ben strutturato del dataset lo rende una risorsa essenziale per ricercatori e professionisti nel campo dell'apprendimento automatico e della visione artificiale.
Alcune applicazioni comuni includono:
- Benchmarking di nuovi algoritmi di classificazione
- Scopi educativi per l'insegnamento dei concetti di apprendimento automatico
- Prototipazione di sistemi di riconoscimento delle immagini
- Verifica delle tecniche di ottimizzazione dei modelli
Utilizzo
Per addestrare un modello CNN sul dataset MNIST per 100 epoche con un'immagine di dimensioni 32×32, si possono usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.
Esempio di treno
Immagini di esempio e annotazioni
Il dataset MNIST contiene immagini in scala di grigi di cifre scritte a mano, fornendo un dataset ben strutturato per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:
L'esempio mostra la varietà e la complessità delle cifre scritte a mano nel dataset MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli robusti di classificazione delle immagini.
Citazioni e ringraziamenti
Se utilizzate il set di dati MNIST nel vostro lavoro di ricerca o sviluppo, citate il seguente documento:
Desideriamo ringraziare Yann LeCun, Corinna Cortes e Christopher J.C. Burges per aver creato e mantenuto il dataset MNIST come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul dataset MNIST e sui suoi creatori, visitare il sito web del dataset MNIST.
FAQ
Che cos'è il dataset MNIST e perché è importante per l'apprendimento automatico?
Il dataset MNIST, o dataset modificato del National Institute of Standards and Technology, è una raccolta di cifre scritte a mano ampiamente utilizzata per l'addestramento e il test dei sistemi di classificazione delle immagini. Comprende 60.000 immagini di addestramento e 10.000 immagini di test, tutte in scala di grigi e di dimensioni 28×28 pixel. L'importanza del dataset risiede nel suo ruolo di benchmark standard per la valutazione degli algoritmi di classificazione delle immagini, aiutando ricercatori e ingegneri a confrontare i metodi e a seguire i progressi nel campo.
Come posso utilizzare Ultralytics YOLO per addestrare un modello sul dataset MNIST?
Per addestrare un modello sul dataset MNIST utilizzando Ultralytics YOLO , si possono seguire i seguenti passaggi:
Esempio di treno
Per un elenco dettagliato degli argomenti di formazione disponibili, consultare la pagina Formazione.
Qual è la differenza tra i dataset MNIST e EMNIST?
Il dataset MNIST contiene solo cifre scritte a mano, mentre il dataset Extended MNIST (EMNIST) comprende sia cifre che lettere maiuscole e minuscole. EMNIST è stato sviluppato come successore di MNIST e utilizza lo stesso formato 28×28 pixel per le immagini, rendendolo compatibile con gli strumenti e i modelli progettati per il dataset MNIST originale. Questa gamma più ampia di caratteri in EMNIST lo rende utile per una maggiore varietà di applicazioni di apprendimento automatico.
È possibile utilizzare Ultralytics HUB per addestrare modelli su dataset personalizzati come MNIST?
Sì, è possibile utilizzare Ultralytics HUB per addestrare modelli su set di dati personalizzati come MNIST. Ultralytics HUB offre un'interfaccia facile da usare per caricare i set di dati, addestrare i modelli e gestire i progetti senza bisogno di conoscenze di codifica approfondite. Per maggiori dettagli su come iniziare, consultate la pagina Ultralytics HUB Quickstart.
Come si colloca MNIST rispetto ad altri dataset di classificazione delle immagini?
MNIST è più semplice di molti dataset moderni come CIFAR-10 o ImageNet, ed è quindi ideale per i principianti e per una rapida sperimentazione. Anche se i dataset più complessi offrono maggiori sfide con immagini a colori e diverse categorie di oggetti, MNIST rimane prezioso per la sua semplicità, le dimensioni ridotte del file e l'importanza storica nello sviluppo degli algoritmi di apprendimento automatico. Per compiti di classificazione più avanzati, è possibile utilizzare Fashion-MNIST, che mantiene la stessa struttura ma presenta articoli di abbigliamento anziché cifre.