Skip to content

Ensemble de données MNIST

L'ensemble de données MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits qui est couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles d'apprentissage automatique. Il a été créé en "remélangeant" les échantillons des ensembles de données originaux du NIST et est devenu une référence pour l'évaluation des performances des algorithmes de classification d'images.

Caractéristiques principales

  • MNIST contient 60 000 images d'apprentissage et 10 000 images de test de chiffres manuscrits.
  • L'ensemble de donnĂ©es comprend des images en niveaux de gris d'une taille de 28x28 pixels.
  • Les images sont normalisĂ©es pour entrer dans une boĂ®te de dĂ©limitation de 28x28 pixels et anticrĂ©nelĂ©es, en introduisant des niveaux de gris.
  • MNIST est largement utilisĂ© pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données MNIST est divisé en deux sous-ensembles :

  1. Ensemble de formation: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

MNIST Ă©tendu (EMNIST)

Extended MNIST (EMNIST) est un nouvel ensemble de données développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST inclut toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres manuscrites majuscules et minuscules ainsi que de chiffres. Les images de l'EMNIST ont été converties au même format de 28x28 pixels, selon le même processus, que les images du MNIST. Par conséquent, les outils qui fonctionnent avec l'ensemble de données MNIST, plus ancien et plus petit, fonctionneront probablement sans modification avec EMNIST.

Applications

L'ensemble de données MNIST est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données MNIST pendant 100 époques avec une taille d'image de 32x32, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='mnist', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
cnn detect train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données MNIST contient des images en niveaux de gris de chiffres manuscrits, ce qui constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des chiffres manuscrits de l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

Citations et remerciements

Si tu utilises l'ensemble de données MNIST dans ton

travail de recherche ou de développement, cite l'article suivant :

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance de l'ensemble de données MNIST, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données MNIST et ses créateurs, visite le site Web de l'ensemble de données MNIST.



Créé le 2023-11-12, Mis à jour le 2023-11-22
Auteurs : glenn-jocher (3)

Commentaires