Skip to content

Ensemble de données MNIST

L'ensemble de données MNIST (Modified National Institute of Standards and Technology) est une grande base de données de chiffres manuscrits couramment utilisée pour l'entraînement de divers systèmes de traitement d'images et de modèles d'apprentissage automatique. Il a été créé en "remélangeant" les échantillons des ensembles de données originaux du NIST et est devenu une référence pour l'évaluation des performances des algorithmes de classification d'images.

Caractéristiques principales

  • Le MNIST contient 60 000 images d'apprentissage et 10 000 images de test de chiffres manuscrits.
  • L'ensemble de donnĂ©es comprend des images en niveaux de gris d'une taille de 28x28 pixels.
  • Les images sont normalisĂ©es pour entrer dans une boĂ®te de dĂ©limitation de 28x28 pixels et anticrĂ©nelĂ©es, introduisant des niveaux de gris.
  • MNIST est largement utilisĂ© pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données MNIST est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour la formation de modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

MNIST Ă©tendu (EMNIST)

Le MNIST étendu (EMNIST) est un nouvel ensemble de données développé et publié par le NIST pour succéder au MNIST. Alors que MNIST ne contenait que des images de chiffres manuscrits, EMNIST inclut toutes les images de la base de données spéciale 19 du NIST, qui est une grande base de données de lettres majuscules et minuscules manuscrites ainsi que de chiffres. Les images de l'EMNIST ont été converties dans le même format de 28x28 pixels, selon le même processus, que les images du MNIST. Par conséquent, les outils qui fonctionnent avec l'ensemble de données MNIST, plus ancien et plus petit, fonctionneront probablement sans modification avec EMNIST.

Applications

L'ensemble de données MNIST est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré de l'ensemble de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle CNN sur l'ensemble de données MNIST pour 100 époques avec une taille d'image de 32x32, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Exemples d'images et d'annotations

L'ensemble de données MNIST contient des images en niveaux de gris de chiffres manuscrits, ce qui en fait un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon de l'ensemble de données

L'exemple montre la variété et la complexité des chiffres manuscrits dans l'ensemble de données MNIST, soulignant l'importance d'un ensemble de données diversifié pour la formation de modèles de classification d'images robustes.

Citations et remerciements

Si vous utilisez l'ensemble de données MNIST dans votre

de recherche ou de développement, veuillez citer l'article suivant :

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour la création et la maintenance de l'ensemble de données MNIST, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données MNIST et ses créateurs, visitez le site web de l'ensemble de données MNIST.

FAQ

Qu'est-ce que l'ensemble de données MNIST et pourquoi est-il important pour l'apprentissage automatique ?

L'ensemble de données MNIST, ou Modified National Institute of Standards and Technology dataset, est une collection largement utilisée de chiffres manuscrits conçue pour former et tester les systèmes de classification d'images. Il comprend 60 000 images d'apprentissage et 10 000 images de test, toutes en niveaux de gris et d'une taille de 28 x 28 pixels. L'importance de l'ensemble de données réside dans son rôle de référence standard pour l'évaluation des algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès réalisés dans ce domaine.

Comment puis-je utiliser Ultralytics YOLO pour former un modèle sur l'ensemble de données MNIST ?

Pour former un modèle sur l'ensemble de données MNIST à l'aide de Ultralytics YOLO , vous pouvez suivre les étapes suivantes :

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Pour une liste détaillée des arguments de formation disponibles, consultez la page Formation.

Quelle est la différence entre les ensembles de données MNIST et EMNIST ?

L'ensemble de données MNIST ne contient que des chiffres manuscrits, tandis que l'ensemble de données MNIST étendu (EMNIST) comprend à la fois des chiffres et des lettres majuscules et minuscules. EMNIST a été développé pour succéder à MNIST et utilise le même format de 28x28 pixels pour les images, ce qui le rend compatible avec les outils et les modèles conçus pour l'ensemble de données MNIST original. L'éventail de caractères plus large de l'EMNIST le rend utile pour une plus grande variété d'applications d'apprentissage automatique.

Puis-je utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés tels que MNIST ?

Oui, vous pouvez utiliser Ultralytics HUB pour entraîner des modèles sur des ensembles de données personnalisés comme MNIST. Ultralytics HUB offre une interface conviviale pour télécharger des ensembles de données, entraîner des modèles et gérer des projets sans nécessiter de connaissances approfondies en matière de codage. Pour plus de détails sur la façon de commencer, consultez la page Ultralytics HUB Quickstart.

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois

Commentaires