Link to this sectionDataset MNIST#
Il dataset MNIST (Modified National Institute of Standards and Technology) è un ampio database di cifre scritte a mano comunemente utilizzato per addestrare vari sistemi di elaborazione delle immagini e modelli di machine learning. È stato creato "rimiscelando" i campioni dai dataset originali del NIST ed è diventato un punto di riferimento per valutare le prestazioni degli algoritmi di classificazione delle immagini.
Link to this sectionCaratteristiche principali#
- MNIST contiene 60.000 immagini di addestramento e 10.000 immagini di test di cifre scritte a mano.
- Il dataset comprende immagini in scala di grigi di dimensioni 28×28 pixel.
- Le immagini sono normalizzate per adattarsi a un bounding box di 28×28 pixel e sottoposte ad anti-aliasing, il che introduce livelli di scala di grigi.
- MNIST è ampiamente utilizzato per l'addestramento e il test nel campo del machine learning, specialmente per le attività di classificazione delle immagini.
Link to this sectionStruttura del dataset#
Il dataset MNIST è suddiviso in due sottoinsiemi:
- Training Set: Questo sottoinsieme contiene 60.000 immagini di cifre scritte a mano utilizzate per addestrare i modelli di machine learning.
- Testing Set: Questo sottoinsieme consiste in 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.
Link to this sectionAccesso al Dataset#
- File originali: Scarica gli archivi gzip dall'archivio MNIST originale se desideri il controllo diretto sulla pre-elaborazione.
- Caricatore Ultralytics: Usa
data="mnist"(odata="mnist160"per il sottoinsieme seguente) nel tuo comando e il dataset verrà scaricato, convertito in PNG e memorizzato nella cache automaticamente.
Ogni immagine nel dataset è etichettata con la cifra corrispondente (0-9), rendendolo un dataset di apprendimento supervisionato ideale per attività di classificazione.
Link to this sectionExtended MNIST (EMNIST)#
Extended MNIST (EMNIST) è un dataset più recente sviluppato e rilasciato dal NIST come successore di MNIST. Mentre MNIST includeva solo immagini di cifre scritte a mano, EMNIST include tutte le immagini del NIST Special Database 19, che è un ampio database di lettere maiuscole e minuscole scritte a mano, oltre alle cifre. Le immagini in EMNIST sono state convertite nello stesso formato 28×28 pixel, tramite lo stesso processo delle immagini MNIST. Di conseguenza, gli strumenti che funzionano con il dataset MNIST più vecchio e piccolo funzioneranno probabilmente senza modifiche con EMNIST.
Link to this sectionApplicazioni#
Il dataset MNIST è ampiamente utilizzato per addestrare e valutare modelli di deep learning in attività di classificazione delle immagini, come Convolutional Neural Networks (CNN), Support Vector Machines (SVM) e vari altri algoritmi di machine learning. Il formato semplice e ben strutturato del dataset lo rende una risorsa essenziale per ricercatori e professionisti nel campo del machine learning e della computer vision.
Alcune applicazioni comuni includono:
- Benchmark di nuovi algoritmi di classificazione
- Scopi educativi per l'insegnamento di concetti di machine learning
- Prototipazione di sistemi di riconoscimento immagini
- Test di tecniche di ottimizzazione dei modelli
Link to this sectionUtilizzo#
Per addestrare un modello CNN sul dataset MNIST per 100 epoch con una dimensione immagine di 28×28, puoi usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Link to this sectionEsempi di immagini e annotazioni#
Il dataset MNIST contiene immagini in scala di grigi di cifre scritte a mano, fornendo un dataset ben strutturato per attività di classificazione delle immagini. Ecco alcuni esempi di immagini dal dataset:

L'esempio mostra la varietà e la complessità delle cifre scritte a mano nel dataset MNIST, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli robusti di classificazione delle immagini.
Link to this sectionCitazioni e riconoscimenti#
Se utilizzi il dataset MNIST nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Desideriamo ringraziare Yann LeCun, Corinna Cortes e Christopher J.C. Burges per aver creato e mantenuto il dataset MNIST come risorsa preziosa per la comunità di ricerca sul machine learning e la computer vision. Per ulteriori informazioni sul dataset MNIST e sui suoi creatori, visita il sito web del dataset MNIST.
Link to this sectionTest rapidi con MNIST160#
Hai bisogno di un test di regressione ultra-rapido? Ultralytics espone anche data="mnist160", una porzione di 160 immagini contenente le prime otto immagini di ogni cifra (0-9) sia dagli split di training che di test. Rispecchia la struttura delle directory di MNIST, così puoi scambiare i dataset senza modificare altri argomenti:
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Usa questo sottoinsieme per le pipeline CI o per controlli di integrità prima di impegnarti con l'intero dataset da 70.000 immagini.
Link to this sectionFAQ#
Link to this sectionCos'è il dataset MNIST e perché è importante nel machine learning?#
Il dataset MNIST, o dataset Modified National Institute of Standards and Technology, è una collezione ampiamente utilizzata di cifre scritte a mano progettata per addestrare e testare sistemi di classificazione delle immagini. Include 60.000 immagini di training e 10.000 immagini di test, tutte in scala di grigi e di dimensioni 28×28 pixel. L'importanza del dataset risiede nel suo ruolo di punto di riferimento standard per valutare gli algoritmi di classificazione delle immagini, aiutando ricercatori e ingegneri a confrontare i metodi e monitorare i progressi nel campo.
Link to this sectionCome posso usare Ultralytics YOLO per addestrare un modello sul dataset MNIST?#
Per addestrare un modello sul dataset MNIST utilizzando Ultralytics YOLO, puoi seguire questi passaggi:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Per un elenco dettagliato degli argomenti di addestramento disponibili, fai riferimento alla pagina Training.
Link to this sectionQual è la differenza tra i dataset MNIST e EMNIST?#
Il dataset MNIST contiene solo cifre scritte a mano, mentre il dataset Extended MNIST (EMNIST) include sia cifre che lettere maiuscole e minuscole. EMNIST è stato sviluppato come successore di MNIST e utilizza lo stesso formato 28×28 pixel per le immagini, rendendolo compatibile con strumenti e modelli progettati per il dataset MNIST originale. Questa gamma più ampia di caratteri in EMNIST lo rende utile per una maggiore varietà di applicazioni di machine learning.
Link to this sectionPosso utilizzare la Piattaforma Ultralytics per addestrare modelli su dataset personalizzati come MNIST?#
Sì, puoi utilizzare la Piattaforma Ultralytics per addestrare modelli su dataset personalizzati come MNIST. La Piattaforma Ultralytics offre un'interfaccia intuitiva per caricare dataset, addestrare modelli e gestire progetti senza bisogno di approfondite conoscenze di programmazione. Per maggiori dettagli su come iniziare, consulta la pagina Quickstart della Piattaforma Ultralytics.
Link to this sectionCome si confronta MNIST con altri dataset di classificazione delle immagini?#
MNIST è più semplice di molti dataset moderni come CIFAR-10 o ImageNet, il che lo rende ideale per i principianti e per esperimenti rapidi. Mentre dataset più complessi offrono sfide maggiori con immagini a colori e diverse categorie di oggetti, MNIST rimane prezioso per la sua semplicità, le dimensioni ridotte dei file e il significato storico nello sviluppo degli algoritmi di machine learning. Per attività di classificazione più avanzate, prendi in considerazione l'utilizzo di Fashion-MNIST, che mantiene la stessa struttura ma presenta articoli di abbigliamento invece di cifre.