Jeu de données MNIST

Q: What is the MNIST dataset, and why is it important in machine learning?

L'ensemble de données MNIST, ou Modified National Institute of Standards and Technology dataset, est une collection largement utilisée de chiffres manuscrits conçue pour l'entraînement et le test des systèmes de classification d'images. Il comprend 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et de 28×28 pixels. L'importance de l'ensemble de données réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.

Le dataset MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits qui est couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles de machine learning. Il a été créé en "re-mixant" les échantillons des datasets originaux du NIST et est devenu une référence pour l'évaluation des performances des algorithmes d'image classification.

Principales caractéristiques

MNIST contient 60 000 images d'entraînement et 10 000 images de test de chiffres manuscrits.
L'ensemble de données comprend des images en niveaux de gris de taille 28×28 pixels.
Les images sont normalisées pour tenir dans une boîte englobante de 28×28 pixels et sont anticrénelées, introduisant des niveaux de gris.
MNIST est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure du jeu de données

L'ensemble de données MNIST est divisé en deux sous-ensembles :

Ensemble d’entraînement: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour l’entraînement des modèles d’apprentissage automatique.
Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Accès au jeu de données

Fichiers originaux : Téléchargez les archives gzip à partir de la page MNIST de Yann LeCun si vous souhaitez un contrôle direct sur le prétraitement.
chargeur Ultralytics: Utilisez data="mnist" (ou data="mnist160" pour le sous-ensemble ci-dessous) dans votre commande et l'ensemble de données sera téléchargé, converti en PNG et mis en cache automatiquement.

Chaque image de l'ensemble de données est étiquetée avec le chiffre correspondant (0 à 9), ce qui en fait un ensemble de données d'apprentissage supervisé idéal pour les tâches de classification.

Extended MNIST (EMNIST)

Extended MNIST (EMNIST) est un ensemble de données plus récent développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST comprend toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres majuscules et minuscules manuscrites ainsi que de chiffres. Les images d'EMNIST ont été converties au même format de 28×28 pixels, par le même processus, que les images MNIST. En conséquence, les outils qui fonctionnent avec l'ensemble de données MNIST plus ancien et plus petit fonctionneront probablement sans modification avec EMNIST.

Applications

L'ensemble de données MNIST est largement utilisé pour l'entraînement et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Voici quelques applications courantes :

Évaluation comparative de nouveaux algorithmes de classification
Fins éducatives pour l'enseignement des concepts d'apprentissage automatique
Prototypage de systèmes de reconnaissance d'images
Test des techniques d'optimisation des modèles

Utilisation

Pour entraîner un modèle CNN sur le dataset MNIST pendant 100 epochs avec une taille d'image de 28×28, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Training (Entraînement) du modèle.

Exemple d'entraînement

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo26n-cls.pt epochs=100 imgsz=28

Images et annotations d'exemple

L'ensemble de données MNIST contient des images en niveaux de gris de chiffres manuscrits, fournissant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images de l'ensemble de données :

Exemples tirés de l'ensemble de données MNIST pour la classification des chiffres MNIST

L'exemple illustre la variété et la complexité des chiffres manuscrits dans l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour l'entraînement de modèles de classification d'images robustes.

Citations et remerciements

Si vous utilisez l'ensemble de données MNIST dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

BibTeX

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance du jeu de données MNIST, une ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données MNIST et ses créateurs, consultez le site web du jeu de données MNIST.

Tests Rapides MNIST160

Besoin d'un test de régression ultra-rapide ? Ultralytics expose également data="mnist160", une tranche de 160 images contenant les huit premiers échantillons de chaque classe de chiffres. Elle reflète la structure du répertoire MNIST, vous pouvez donc échanger des ensembles de données sans modifier d'autres arguments :

Exemple d'entraînement avec MNIST160

CLI

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Utilisez ce sous-ensemble pour les pipelines CI ou les contrôles de cohérence avant de valider l'ensemble complet de données de 70 000 images.

FAQ

Qu'est-ce que l'ensemble de données MNIST et pourquoi est-il important dans l'apprentissage automatique ?

Le dataset MNIST, ou Modified National Institute of Standards and Technology dataset, est une collection largement utilisée de chiffres manuscrits conçue pour l'entraînement et le test de systèmes de classification d'images. Il comprend 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et de taille 28×28 pixels. L'importance du dataset réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.

Comment puis-je utiliser Ultralytics YOLO pour entraîner un modèle sur l'ensemble de données MNIST ?

Pour entraîner un modèle sur le dataset MNIST en utilisant Ultralytics YOLO, vous pouvez suivre ces étapes :

Exemple d'entraînement

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo26n-cls.pt epochs=100 imgsz=28

Pour une liste détaillée des arguments d'entraînement disponibles, consultez la page Entraînement.

Quelle est la différence entre les ensembles de données MNIST et EMNIST ?

L'ensemble de données MNIST contient uniquement des chiffres manuscrits, tandis que l'ensemble de données Extended MNIST (EMNIST) comprend à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé comme successeur de MNIST et utilise le même format d'image de 28×28 pixels, ce qui le rend compatible avec les outils et les modèles conçus pour l'ensemble de données MNIST original. Cette gamme plus large de caractères dans EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.

Puis-je utiliser la plateforme Ultralytics pour entraîner des modèles sur des jeux de données personnalisés comme MNIST ?

Oui, vous pouvez utiliser la plateforme Ultralytics pour entraîner des modèles sur des jeux de données personnalisés comme MNIST. La plateforme Ultralytics offre une interface conviviale pour télécharger des jeux de données, entraîner des modèles et gérer des projets sans nécessiter de connaissances approfondies en codage. Pour plus de détails sur la prise en main, consultez la page de démarrage rapide de la plateforme Ultralytics.

Comment MNIST se compare-t-il à d'autres ensembles de données de classification d'images ?

MNIST est plus simple que de nombreux jeux de données modernes comme CIFAR-10 ou ImageNet, ce qui le rend idéal pour les débutants et l'expérimentation rapide. Bien que les jeux de données plus complexes offrent de plus grands défis avec des images couleur et diverses catégories d'objets, MNIST reste précieux pour sa simplicité, sa petite taille de fichier et son importance historique dans le développement d'algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, envisagez d'utiliser Fashion-MNIST, qui conserve la même structure mais présente des vêtements au lieu de chiffres.

📅 Créé il y a 2 ans ✍️ Mis à jour il y a 3 mois