Vai al contenuto

Dataset MNIST

Il dataset MNIST (Modified National Institute of Standards and Technology) è un grande database di cifre scritte a mano che viene comunemente utilizzato per addestrare diversi sistemi di elaborazione delle immagini e modelli di apprendimento automatico. È stato creato "rimescolando" i campioni dei set di dati originali del NIST ed è diventato un punto di riferimento per valutare le prestazioni degli algoritmi di classificazione delle immagini.

Caratteristiche principali

  • MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di prova di cifre scritte a mano.
  • Il set di dati comprende immagini in scala di grigi di dimensioni 28x28 pixel.
  • The images are normalized to fit into a 28x28 pixel bounding box and anti-aliased, introducing grayscale levels.
  • MNIST è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di classificazione delle immagini.

Struttura del set di dati

Il dataset MNIST è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 60.000 immagini di cifre scritte a mano utilizzate per addestrare i modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

MNIST esteso (EMNIST)

L'Extended MNIST (EMNIST) è un nuovo dataset sviluppato e rilasciato dal NIST come successore di MNIST. Mentre MNIST comprendeva solo immagini di cifre scritte a mano, EMNIST include tutte le immagini del NIST Special Database 19, un ampio database di lettere maiuscole e minuscole scritte a mano e di cifre. Le immagini di EMNIST sono state convertite nello stesso formato 28x28 pixel, con lo stesso processo, delle immagini di MNIST. Di conseguenza, gli strumenti che funzionano con il dataset MNIST, più vecchio e più piccolo, probabilmente funzioneranno senza modifiche con EMNIST.

Applicazioni

The MNIST dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The dataset's simple and well-structured format makes it an essential resource for researchers and practitioners in the field of machine learning and computer vision.

Utilizzo

To train a CNN model on the MNIST dataset for 100 epochs with an image size of 32x32, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Immagini di esempio e annotazioni

The MNIST dataset contains grayscale images of handwritten digits, providing a well-structured dataset for image classification tasks. Here are some examples of images from the dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità delle cifre scritte a mano nel dataset MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di robusti modelli di classificazione delle immagini.

Citazioni e ringraziamenti

Se utilizzi il set di dati MNIST nel tuo

per un lavoro di ricerca o di sviluppo, si prega di citare il seguente documento:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

We would like to acknowledge Yann LeCun, Corinna Cortes, and Christopher J.C. Burges for creating and maintaining the MNIST dataset as a valuable resource for the machine learning and computer vision research community. For more information about the MNIST dataset and its creators, visit the MNIST dataset website.

DOMANDE FREQUENTI

Cos'è il dataset MNIST e perché è importante per l'apprendimento automatico?

Il dataset MNIST, o dataset modificato del National Institute of Standards and Technology, è una raccolta di cifre scritte a mano molto utilizzata per addestrare e testare i sistemi di classificazione delle immagini. Comprende 60.000 immagini di addestramento e 10.000 immagini di test, tutte in scala di grigi e con dimensioni di 28x28 pixel. L'importanza del dataset risiede nel suo ruolo di punto di riferimento standard per la valutazione degli algoritmi di classificazione delle immagini, aiutando ricercatori e ingegneri a confrontare i metodi e a seguire i progressi nel campo.

Come posso utilizzare Ultralytics YOLO per addestrare un modello sul dataset MNIST?

Per addestrare un modello sul dataset MNIST utilizzando Ultralytics YOLO , puoi seguire i seguenti passaggi:

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Per un elenco dettagliato degli argomenti di formazione disponibili, consulta la pagina Formazione.

Qual è la differenza tra i dataset MNIST e EMNIST?

Il dataset MNIST contiene solo cifre scritte a mano, mentre il dataset Extended MNIST (EMNIST) include sia cifre che lettere maiuscole e minuscole. EMNIST è stato sviluppato come successore di MNIST e utilizza lo stesso formato di 28x28 pixel per le immagini, rendendolo compatibile con gli strumenti e i modelli progettati per il dataset MNIST originale. Questa gamma più ampia di caratteri in EMNIST lo rende utile per una maggiore varietà di applicazioni di apprendimento automatico.

Posso utilizzare Ultralytics HUB per addestrare modelli su dataset personalizzati come MNIST?

Sì, puoi usare Ultralytics HUB per addestrare modelli su dataset personalizzati come MNIST. Ultralytics HUB offre un'interfaccia facile da usare per caricare i dataset, addestrare i modelli e gestire i progetti senza dover avere conoscenze approfondite di codifica. Per maggiori dettagli su come iniziare, consulta la pagina Ultralytics HUB Quickstart.

📅 Created 1 year ago ✏️ Updated 22 days ago

Commenti