No license

Link to this sectionDataset MNIST#

Name: MNIST Image Classification Dataset
Creator: Yann LeCun
Keywords: MNIST, dataset, cifre scritte a mano, classificazione di immagini, deep learning, machine learning, training set, testing set, NIST

Il dataset MNIST (Modified National Institute of Standards and Technology) è un benchmark di classificazione di immagini composto da 70.000 immagini in scala di grigi 28x28 di cifre scritte a mano che coprono 10 classi: le cifre da 0 a 9. Viene fornito con una suddivisione predefinita di 60.000 immagini di addestramento e 10.000 di test e funge da lungo tempo come benchmark standard per la valutazione di algoritmi di machine learning e computer vision. Per l'equivalente più difficile con immagini di abbigliamento, vedi il dataset correlato Fashion-MNIST; per immagini a colori, vedi CIFAR-10.

Link to this sectionCaratteristiche principali#

MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di test di cifre scritte a mano, per un totale di 70.000.
Ogni immagine è una rappresentazione in scala di grigi 28x28 di una singola cifra, normalizzata e anti-aliased in un bounding box fisso di 28x28.
Le 10 classi coprono le cifre 0–9, con un numero di immagini approssimativamente bilanciato per classe.
Viene fornito con una suddivisione train/test predefinita, quindi non è richiesta alcuna suddivisione manuale o automatica.
MNIST è un benchmark standard per la ricerca nella classificazione di immagini e nel deep learning.

Link to this sectionStruttura del dataset#

MNIST viene fornito con una suddivisione ufficiale predefinita, quindi non è necessaria alcuna partizione automatica o manuale:

Classi: 10 (cifre scritte a mano 0–9)
Immagini totali: 70.000 (28x28 in scala di grigi)
Set di addestramento: 60.000 immagini
Set di test: 10.000 immagini

Split di validazione

MNIST non ha una cartella di validazione separata, quindi Ultralytics utilizza per impostazione predefinita il set di test da 10.000 immagini come split di validazione durante l'addestramento.

Ogni immagine è etichettata con la cifra corrispondente (0–9), rendendo MNIST un dataset supervisionato ideale per attività di classificazione.

Link to this sectionApplicazioni#

MNIST è ampiamente utilizzato per addestrare e valutare modelli di classificazione di immagini, dalle classiche Convolutional Neural Networks (CNN) e Support Vector Machines (SVM) alle moderne architetture profonde. Le sue piccole immagini in scala di grigi e le 10 classi di cifre lo rendono un benchmark veloce e riproducibile per il confronto di algoritmi e la sperimentazione nella computer vision.

Alcune applicazioni comuni includono:

Benchmarking di nuovi algoritmi di classificazione
Scopi educativi per l'insegnamento di concetti di machine learning
Prototipazione di sistemi di riconoscimento immagini
Test di tecniche di ottimizzazione dei modelli

Link to this sectionUtilizzo#

Addestra un modello di classificazione YOLO su MNIST per 100 epoch con una dimensione dell'immagine di 28. Il dataset si scarica e si memorizza nella cache automaticamente al primo utilizzo; se preferisci il controllo completo sulla pre-elaborazione, gli archivi gzip originali sono disponibili anche dal MNIST database. Per l'elenco completo degli argomenti disponibili, vedi la pagina Training e la guida all'attività di classificazione di immagini.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Test rapidi con MNIST160

Ultralytics espone anche data="mnist160", una porzione di 160 immagini contenente le prime otto immagini di ogni cifra (0–9) sia dallo split di addestramento che da quello di test. Rispecchia la struttura delle directory di MNIST, quindi puoi scambiare i dataset senza modificare altri argomenti: ideale per pipeline CI o controlli di integrità prima di impegnarsi nell'intero dataset da 70.000 immagini.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionEsempi di immagini e annotazioni#

Immagini campione dal dataset MNIST:

Campioni del dataset di classificazione delle cifre scritte a mano MNIST

I campioni mostrano la gamma di stili di scrittura a mano che il dataset cattura nelle 10 classi di cifre.

Link to this sectionCitazioni e riconoscimenti#

Se utilizzi il dataset MNIST nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

Citazione

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Vogliamo ringraziare Yann LeCun, Corinna Cortes e Christopher J.C. Burges per aver creato e mantenuto il dataset MNIST come una risorsa preziosa per la comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset MNIST e sui suoi creatori, visita il sito web del dataset MNIST.

Link to this sectionFAQ#

Link to this sectionCos'è il dataset MNIST e perché è importante nel machine learning?#

Il dataset MNIST è un benchmark di 70.000 immagini in scala di grigi 28x28 di cifre scritte a mano, suddiviso in 60.000 immagini di addestramento e 10.000 di test su 10 classi da 0 a 9. È il riferimento standard per la valutazione di algoritmi di classificazione di immagini: il suo formato piccolo e uniforme consente a ricercatori e ingegneri di confrontare metodi e monitorare i progressi con una configurazione minima, motivo per cui rimane un primo benchmark comune nel machine learning.

Link to this sectionQuante classi e immagini ha il dataset MNIST?#

MNIST ha 10 classi (le cifre scritte a mano da 0 a 9) e un totale di 70.000 immagini in scala di grigi, ciascuna di 28x28 pixel. Viene fornito con una suddivisione predefinita di 60.000 immagini di addestramento e 10.000 immagini di test, con un numero approssimativamente uguale di esempi per cifra.

Link to this sectionCome posso usare Ultralytics YOLO per addestrare un modello sul dataset MNIST?#

Per addestrare un modello YOLO di Ultralytics su MNIST, usa i frammenti di codice qui sotto. Il dataset viene scaricato automaticamente al primo utilizzo. Per un elenco dettagliato degli argomenti di addestramento disponibili, fai riferimento alla pagina Training.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionCome viene suddiviso il dataset MNIST in set di addestramento e test?#

MNIST viene fornito con una suddivisione predefinita di 60.000 immagini di addestramento e 10.000 immagini di test. A differenza dei dataset di classificazione basati su cartelle che Ultralytics divide automaticamente, la partizione ufficiale di MNIST viene utilizzata così com'è e il set di test funge da split di validazione durante l'addestramento per impostazione predefinita.

Link to this sectionQual è la differenza tra i dataset MNIST e EMNIST?#

Il dataset MNIST contiene solo cifre scritte a mano, mentre il dataset Extended MNIST (EMNIST) include sia cifre che lettere maiuscole e minuscole. EMNIST è stato sviluppato come successore di MNIST e utilizza lo stesso formato di 28x28 pixel, rendendolo compatibile con strumenti e modelli progettati per il dataset MNIST originale. Questa gamma più ampia di caratteri rende EMNIST utile per una maggiore varietà di applicazioni di machine learning.

Link to this sectionPosso utilizzare Ultralytics Platform per addestrare modelli su dataset come MNIST?#

Sì. Ultralytics Platform ti consente di caricare dataset, addestrare modelli di classificazione di immagini e distribuirli senza un'ampia programmazione. È un modo conveniente per eseguire esperimenti MNIST nel cloud; vedi la panoramica sui dataset di classificazione per opzioni correlate.

Link to this sectionCome si confronta MNIST con altri dataset di classificazione delle immagini?#

MNIST è più semplice di molti dataset moderni come CIFAR-10 o ImageNet, rendendolo ideale per i principianti e per esperimenti rapidi. Mentre dataset più complessi offrono sfide maggiori con immagini a colori e diverse categorie di oggetti, MNIST rimane prezioso per la sua semplicità, le ridotte dimensioni del file e il significato storico nello sviluppo di algoritmi di machine learning. Per un sostituto più difficile con la stessa struttura, vedi Fashion-MNIST, che presenta articoli di abbigliamento invece di cifre.

Collaboratori

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Creato 12 nov 2023Aggiornato ieri