Jeu de données MNIST
Le dataset MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits qui est couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles de machine learning. Il a été créé en "re-mixant" les échantillons des datasets originaux du NIST et est devenu une référence pour l'évaluation des performances des algorithmes d'image classification.
Principales caractéristiques
- MNIST contient 60 000 images d'entraînement et 10 000 images de test de chiffres manuscrits.
- L'ensemble de données comprend des images en niveaux de gris de taille 28×28 pixels.
- Les images sont normalisées pour tenir dans une boîte englobante de 28×28 pixels et sont anticrénelées, introduisant des niveaux de gris.
- MNIST est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.
Structure du jeu de données
L'ensemble de données MNIST est divisé en deux sous-ensembles :
- Ensemble d’entraînement: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour l’entraînement des modèles d’apprentissage automatique.
- Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.
Accès aux données
- Fichiers originaux : Téléchargez les archives gzip à partir de la page MNIST de Yann LeCun si vous souhaitez un contrôle direct sur le prétraitement.
- chargeur Ultralytics: Utilisez
data="mnist"(oudata="mnist160"pour le sous-ensemble ci-dessous) dans votre commande et l'ensemble de données sera téléchargé, converti en PNG et mis en cache automatiquement.
Chaque image de l'ensemble de données est étiquetée avec le chiffre correspondant (0 à 9), ce qui en fait un ensemble de données d'apprentissage supervisé idéal pour les tâches de classification.
Extended MNIST (EMNIST)
Extended MNIST (EMNIST) est un ensemble de données plus récent développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST comprend toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres majuscules et minuscules manuscrites ainsi que de chiffres. Les images d'EMNIST ont été converties au même format de 28×28 pixels, par le même processus, que les images MNIST. En conséquence, les outils qui fonctionnent avec l'ensemble de données MNIST plus ancien et plus petit fonctionneront probablement sans modification avec EMNIST.
Applications
L'ensemble de données MNIST est largement utilisé pour l'entraînement et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Voici quelques applications courantes :
- Évaluation comparative de nouveaux algorithmes de classification
- Fins éducatives pour l'enseignement des concepts d'apprentissage automatique
- Prototypage de systèmes de reconnaissance d'images
- Test des techniques d'optimisation des modèles
Utilisation
Pour entraîner un modèle CNN sur le dataset MNIST pendant 100 epochs avec une taille d'image de 28×28, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Training (Entraînement) du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Images et annotations d'exemple
L'ensemble de données MNIST contient des images en niveaux de gris de chiffres manuscrits, fournissant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images de l'ensemble de données :

L'exemple illustre la variété et la complexité des chiffres manuscrits dans l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour l'entraînement de modèles de classification d'images robustes.
Citations et remerciements
Si vous utilisez l'ensemble de données MNIST dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
volume={2},
year={2010}
}
Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance du jeu de données MNIST, une ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données MNIST et ses créateurs, consultez le site web du jeu de données MNIST.
Tests Rapides MNIST160
Besoin d'un test de régression ultra-rapide ? Ultralytics expose également data="mnist160", une tranche de 160 images contenant les huit premiers échantillons de chaque classe de chiffres. Elle reflète la structure du répertoire MNIST, vous pouvez donc échanger des ensembles de données sans modifier d'autres arguments :
Exemple d'entraînement avec MNIST160
yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=5 imgsz=28
Utilisez ce sous-ensemble pour les pipelines CI ou les contrôles de cohérence avant de valider l'ensemble complet de données de 70 000 images.
FAQ
Qu'est-ce que l'ensemble de données MNIST et pourquoi est-il important dans l'apprentissage automatique ?
Le dataset MNIST, ou Modified National Institute of Standards and Technology dataset, est une collection largement utilisée de chiffres manuscrits conçue pour l'entraînement et le test de systèmes de classification d'images. Il comprend 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et de taille 28×28 pixels. L'importance du dataset réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.
Comment puis-je utiliser Ultralytics YOLO pour entraîner un modèle sur l'ensemble de données MNIST ?
Pour entraîner un modèle sur le dataset MNIST en utilisant Ultralytics YOLO, vous pouvez suivre ces étapes :
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28
Pour une liste détaillée des arguments d'entraînement disponibles, consultez la page Entraînement.
Quelle est la différence entre les ensembles de données MNIST et EMNIST ?
L'ensemble de données MNIST contient uniquement des chiffres manuscrits, tandis que l'ensemble de données Extended MNIST (EMNIST) comprend à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé comme successeur de MNIST et utilise le même format d'image de 28×28 pixels, ce qui le rend compatible avec les outils et les modèles conçus pour l'ensemble de données MNIST original. Cette gamme plus large de caractères dans EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.
Puis-je utiliser Ultralytics HUB pour entraîner des modèles sur des datasets personnalisés comme MNIST ?
Oui, vous pouvez utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés comme MNIST. Ultralytics HUB offre une interface conviviale pour télécharger des ensembles de données, entraîner des modèles et gérer des projets sans avoir besoin de connaissances approfondies en codage. Pour plus de détails sur la façon de commencer, consultez la page Ultralytics HUB Quickstart.
Comment MNIST se compare-t-il à d'autres ensembles de données de classification d'images ?
MNIST est plus simple que de nombreux jeux de données modernes comme CIFAR-10 ou ImageNet, ce qui le rend idéal pour les débutants et l'expérimentation rapide. Bien que les jeux de données plus complexes offrent de plus grands défis avec des images couleur et diverses catégories d'objets, MNIST reste précieux pour sa simplicité, sa petite taille de fichier et son importance historique dans le développement d'algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, envisagez d'utiliser Fashion-MNIST, qui conserve la même structure mais présente des vêtements au lieu de chiffres.