Skip to content

Ensemble de données MNIST

L'ensemble de données MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles d'apprentissage automatique. Il a été créé en "remélangeant" les échantillons des ensembles de données originaux du NIST et est devenu une référence pour l'évaluation des performances des algorithmes de classification d'images.

Caractéristiques principales

  • Le MNIST contient 60 000 images d'apprentissage et 10 000 images de test de chiffres manuscrits.
  • L'ensemble de données comprend des images en niveaux de gris de 28×28 pixels.
  • Les images sont normalisées pour entrer dans une boîte de délimitation de 28×28 pixels et anticrénelées, ce qui permet d'introduire des niveaux de gris.
  • MNIST est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données MNIST est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour la formation de modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Chaque image de l'ensemble de données est étiquetée avec le chiffre correspondant (0-9), ce qui en fait un ensemble de données d'apprentissage supervisé idéal pour les tâches de classification.

MNIST étendu (EMNIST)

Le MNIST étendu (EMNIST) est un nouvel ensemble de données développé et publié par le NIST pour succéder au MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST inclut toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres majuscules et minuscules manuscrites ainsi que de chiffres. Les images de l'EMNIST ont été converties dans le même format de 28×28 pixels, selon le même processus, que les images du MNIST. Par conséquent, les outils qui fonctionnent avec l'ensemble de données MNIST, plus ancien et plus petit, fonctionneront probablement sans modification avec EMNIST.

Applications

L'ensemble de données MNIST est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Parmi les applications les plus courantes, on peut citer

  • Évaluation comparative de nouveaux algorithmes de classification
  • Objectifs pédagogiques pour l'enseignement des concepts de l'apprentissage automatique
  • Prototypage de systèmes de reconnaissance d'images
  • Test des techniques d'optimisation des modèles

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données MNIST pour 100 époques avec une taille d'image de 32×32, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données MNIST contient des images en niveaux de gris de chiffres manuscrits, ce qui en fait un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon de l'ensemble de données

L'exemple montre la variété et la complexité des chiffres manuscrits dans l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour la formation de modèles de classification d'images robustes.

Citations et remerciements

Si vous utilisez l'ensemble de données MNIST dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance de l'ensemble de données MNIST, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données MNIST et ses créateurs, visitez le site web de l'ensemble de données MNIST.

FAQ

Qu'est-ce que l'ensemble de données MNIST et pourquoi est-il important pour l'apprentissage automatique ?

L'ensemble de données MNIST, ou Modified National Institute of Standards and Technology dataset, est une collection largement utilisée de chiffres manuscrits conçus pour entraîner et tester des systèmes de classification d'images. Il comprend 60 000 images d'apprentissage et 10 000 images de test, toutes en niveaux de gris et d'une taille de 28×28 pixels. L'importance de l'ensemble de données réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès réalisés dans ce domaine.

Comment puis-je utiliser Ultralytics YOLO pour former un modèle sur l'ensemble de données MNIST ?

Pour former un modèle sur l'ensemble de données MNIST à l'aide de Ultralytics YOLO , vous pouvez suivre les étapes suivantes :

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Pour une liste détaillée des arguments de formation disponibles, consultez la page Formation.

Quelle est la différence entre les ensembles de données MNIST et EMNIST ?

L'ensemble de données MNIST ne contient que des chiffres manuscrits, tandis que l'ensemble de données MNIST étendu (EMNIST) comprend à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé pour succéder à MNIST et utilise le même format de 28×28 pixels pour les images, ce qui le rend compatible avec les outils et les modèles conçus pour l'ensemble de données MNIST original. L'éventail de caractères plus large de l'EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.

Puis-je utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés tels que MNIST ?

Oui, vous pouvez utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés comme MNIST. Ultralytics HUB offre une interface conviviale pour télécharger des ensembles de données, entraîner des modèles et gérer des projets sans nécessiter de connaissances approfondies en codage. Pour plus de détails sur la façon de commencer, consultez la page de démarrage rapide d'Ultralytics HUB.

Comment MNIST se compare-t-il à d'autres ensembles de données de classification d'images ?

MNIST est plus simple que de nombreux ensembles de données modernes tels que CIFAR-10 ou ImageNet, ce qui en fait un outil idéal pour les débutants et l'expérimentation rapide. Bien que des ensembles de données plus complexes posent de plus grands défis avec des images en couleur et diverses catégories d'objets, MNIST reste précieux pour sa simplicité, sa petite taille de fichier et son importance historique dans le développement d'algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, vous pouvez utiliser Fashion-MNIST, qui conserve la même structure mais présente des vêtements au lieu de chiffres.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires