Jeu de données MNIST
Le jeu de données MNIST (Modified National Institute of Standards and Technology) est une vaste base de données de chiffres manuscrits couramment utilisée pour entraîner divers systèmes de traitement d'images et modèles d'apprentissage automatique. Il a été créé en "remélangeant" des échantillons issus des jeux de données originaux du NIST et est devenu une référence pour évaluer les performances des algorithmes de classification d'images.
Fonctionnalités clés
- MNIST contient 60 000 images d'entraînement et 10 000 images de test de chiffres manuscrits.
- Le jeu de données comprend des images en niveaux de gris de 28×28 pixels.
- Les images sont normalisées pour tenir dans une bounding box de 28×28 pixels et sont anti-crénelées, ce qui introduit des niveaux de gris.
- MNIST est largement utilisé pour l'entraînement et le test dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.
Structure du jeu de données
Le jeu de données MNIST est divisé en deux sous-ensembles :
- Ensemble d'entraînement : Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour entraîner des modèles d'apprentissage automatique.
- Ensemble de test : Ce sous-ensemble se compose de 10 000 images utilisées pour tester et évaluer les modèles entraînés.
Accès au jeu de données
- Fichiers originaux : Télécharge les archives gzip depuis l'archive MNIST originale si tu souhaites un contrôle direct sur le prétraitement.
- Chargeur Ultralytics : Utilise
data="mnist"(oudata="mnist160"pour le sous-ensemble ci-dessous) dans ta commande et le jeu de données sera téléchargé, converti en PNG et mis en cache automatiquement.
Chaque image du jeu de données est étiquetée avec le chiffre correspondant (0-9), ce qui en fait un jeu de données d'apprentissage supervisé idéal pour les tâches de classification.
Extended MNIST (EMNIST)
Extended MNIST (EMNIST) est un jeu de données plus récent développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST inclut toutes les images de la base de données spéciale 19 du NIST, qui est une vaste base de données de lettres manuscrites majuscules et minuscules ainsi que de chiffres. Les images de EMNIST ont été converties dans le même format de 28×28 pixels, par le même processus que les images MNIST. Par conséquent, les outils qui fonctionnent avec l'ancien jeu de données MNIST, plus petit, fonctionneront probablement sans modification avec EMNIST.
Applications
Le jeu de données MNIST est largement utilisé pour entraîner et évaluer des modèles de deep learning dans des tâches de classification d'images, telles que les Convolutional Neural Networks (CNN), les Support Vector Machines (SVM), et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré du jeu de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la computer vision.
Certaines applications courantes incluent :
- L'étalonnage de nouveaux algorithmes de classification
- Des objectifs pédagogiques pour enseigner les concepts d'apprentissage automatique
- Le prototypage de systèmes de reconnaissance d'images
- Le test de techniques d'optimisation de modèles
Utilisation
Pour entraîner un modèle CNN sur le jeu de données MNIST pendant 100 epochs avec une taille d'image de 28×28, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Training du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Exemples d'images et d'annotations
Le jeu de données MNIST contient des images en niveaux de gris de chiffres manuscrits, offrant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images du jeu de données :

L'exemple illustre la variété et la complexité des chiffres manuscrits dans le jeu de données MNIST, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de classification d'images robustes.
Citations et remerciements
Si tu utilises le jeu de données MNIST dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{lecun2010mnist,
title={MNIST handwritten digit database},
author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
journal={ATT Labs [Online]},
volume={2},
year={2010}
}Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour avoir créé et maintenu le jeu de données MNIST en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en computer vision. Pour plus d'informations sur le jeu de données MNIST et ses créateurs, visite le site web du jeu de données MNIST.
Tests rapides MNIST160
Besoin d'un test de régression ultra-rapide ? Ultralytics expose également data="mnist160", une tranche de 160 images contenant les huit premiers échantillons de chaque classe de chiffres. Cela reflète la structure de répertoire de MNIST, tu peux donc échanger les jeux de données sans changer aucun autre argument :
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28Utilise ce sous-ensemble pour les pipelines de CI ou les vérifications de bon fonctionnement avant de t'engager sur le jeu de données complet de 70 000 images.
FAQ
Qu'est-ce que le jeu de données MNIST, et pourquoi est-il important en apprentissage automatique ?
Le jeu de données MNIST, ou jeu de données Modified National Institute of Standards and Technology, est une collection largement utilisée de chiffres manuscrits conçue pour l'entraînement et le test de systèmes de classification d'images. Il comprend 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et d'une taille de 28×28 pixels. L'importance du jeu de données réside dans son rôle de référence standard pour évaluer les algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.
Comment puis-je utiliser Ultralytics YOLO pour entraîner un modèle sur le jeu de données MNIST ?
Pour entraîner un modèle sur le jeu de données MNIST en utilisant Ultralytics YOLO, tu peux suivre ces étapes :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)Pour une liste détaillée des arguments d'entraînement disponibles, consulte la page Training.
Quelle est la différence entre les jeux de données MNIST et EMNIST ?
Le jeu de données MNIST ne contient que des chiffres manuscrits, tandis que le jeu de données Extended MNIST (EMNIST) inclut à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé comme un successeur de MNIST et utilise le même format de 28×28 pixels pour les images, ce qui le rend compatible avec les outils et les modèles conçus pour le jeu de données MNIST original. Cette gamme de caractères plus large dans EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.
Puis-je utiliser Ultralytics Platform pour entraîner des modèles sur des jeux de données personnalisés comme MNIST ?
Oui, tu peux utiliser Ultralytics Platform pour entraîner des modèles sur des jeux de données personnalisés comme MNIST. Ultralytics Platform offre une interface conviviale pour télécharger des jeux de données, entraîner des modèles et gérer des projets sans avoir besoin de connaissances approfondies en codage. Pour plus de détails sur la façon de commencer, consulte la page Ultralytics Platform Quickstart.
Comment MNIST se compare-t-il à d'autres jeux de données de classification d'images ?
MNIST est plus simple que de nombreux jeux de données modernes comme CIFAR-10 ou ImageNet, ce qui le rend idéal pour les débutants et l'expérimentation rapide. Bien que des jeux de données plus complexes offrent de plus grands défis avec des images couleur et diverses catégories d'objets, MNIST reste précieux pour sa simplicité, sa petite taille de fichier et son importance historique dans le développement des algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, envisage d'utiliser Fashion-MNIST, qui conserve la même structure mais propose des articles vestimentaires au lieu de chiffres.