Passer au contenu

Ensemble de données MNIST

L'ensemble de données MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits qui est couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles d'apprentissage automatique. Il a été créé en "remixant" les échantillons des ensembles de données originaux du NIST et est devenu une référence pour évaluer les performances des algorithmes de classification d'images.

Principales caractéristiques

  • MNIST contient 60 000 images d'entraînement et 10 000 images de test de chiffres manuscrits.
  • L'ensemble de données comprend des images en niveaux de gris de taille 28×28 pixels.
  • Les images sont normalisées pour tenir dans une boîte englobante de 28×28 pixels et sont anticrénelées, introduisant des niveaux de gris.
  • MNIST est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure du jeu de données

L'ensemble de données MNIST est divisé en deux sous-ensembles :

  1. Ensemble d’entraînement: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour l’entraînement des modèles d’apprentissage automatique.
  2. Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Chaque image de l'ensemble de données est étiquetée avec le chiffre correspondant (0 à 9), ce qui en fait un ensemble de données d'apprentissage supervisé idéal pour les tâches de classification.

MNIST étendu (EMNIST)

Extended MNIST (EMNIST) est un ensemble de données plus récent développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST comprend toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres majuscules et minuscules manuscrites ainsi que de chiffres. Les images d'EMNIST ont été converties au même format de pixel 28×28, par le même processus, que les images MNIST. En conséquence, les outils qui fonctionnent avec l'ensemble de données MNIST plus ancien et plus petit fonctionneront probablement sans modification avec EMNIST.

Applications

Le dataset MNIST est largement utilisé pour l'entraînement et l'évaluation de modèles de deep learning dans les tâches de classification d'images, telles que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré du dataset en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Voici quelques applications courantes :

  • Évaluation comparative de nouveaux algorithmes de classification
  • Fins éducatives pour l'enseignement des concepts d'apprentissage automatique
  • Prototypage de systèmes de reconnaissance d'images
  • Test des techniques d'optimisation des modèles

Utilisation

Pour entraîner un modèle CNN sur le jeu de données MNIST pendant 100 epochs avec une taille d'image de 32×32, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Training du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Images et annotations d'exemple

Le dataset MNIST contient des images en niveaux de gris de chiffres manuscrits, fournissant un dataset bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images du dataset :

Exemple d'image de l'ensemble de données

L'exemple met en évidence la variété et la complexité des chiffres manuscrits dans l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour l'entraînement de modèles de classification d'images robustes.

Citations et remerciements

Si vous utilisez l'ensemble de données MNIST dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance de l'ensemble de données MNIST, une ressource précieuse pour la communauté de la recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données MNIST et ses créateurs, consultez le site web de l'ensemble de données MNIST.

FAQ

Qu'est-ce que le jeu de données MNIST et pourquoi est-il important dans l'apprentissage automatique ?

L'ensemble de données MNIST, ou ensemble de données Modified National Institute of Standards and Technology, est une collection largement utilisée de chiffres manuscrits conçue pour l'entraînement et le test de systèmes de classification d'images. Il comprend 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et de taille 28×28 pixels. L'importance de cet ensemble de données réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.

Comment puis-je utiliser Ultralytics YOLO pour entraîner un modèle sur l’ensemble de données MNIST ?

Pour entraîner un modèle sur l'ensemble de données MNIST en utilisant Ultralytics YOLO, vous pouvez suivre ces étapes :

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Pour une liste détaillée des arguments d'entraînement disponibles, consultez la page Entraînement.

Quelle est la différence entre les ensembles de données MNIST et EMNIST ?

Le dataset MNIST ne contient que des chiffres manuscrits, tandis que le dataset Extended MNIST (EMNIST) comprend à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé comme successeur de MNIST et utilise le même format d'image de 28×28 pixels, ce qui le rend compatible avec les outils et les modèles conçus pour le dataset MNIST original. Cette gamme plus large de caractères dans EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.

Puis-je utiliser Ultralytics HUB pour former des modèles sur des ensembles de données personnalisés comme MNIST ?

Oui, vous pouvez utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés comme MNIST. Ultralytics HUB offre une interface conviviale pour le téléchargement d'ensembles de données, l'entraînement de modèles et la gestion de projets sans avoir besoin de connaissances approfondies en codage. Pour plus de détails sur la façon de commencer, consultez la page Démarrage rapide d'Ultralytics HUB.

Comment MNIST se compare-t-il à d'autres ensembles de données de classification d'images ?

MNIST est plus simple que de nombreux ensembles de données modernes comme CIFAR-10 ou ImageNet, ce qui le rend idéal pour les débutants et l'expérimentation rapide. Bien que les ensembles de données plus complexes offrent de plus grands défis avec des images couleur et diverses catégories d'objets, MNIST reste précieux pour sa simplicité, sa petite taille de fichier et son importance historique dans le développement d'algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, envisagez d'utiliser Fashion-MNIST, qui conserve la même structure mais présente des vêtements au lieu de chiffres.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 5 mois

Commentaires