Meet YOLO26: next-gen vision AI.

Link to this sectionJeu de données MNIST#

Le jeu de données MNIST (Modified National Institute of Standards and Technology) est une vaste base de données de chiffres manuscrits couramment utilisée pour entraîner divers systèmes de traitement d'images et modèles d'apprentissage automatique. Il a été créé en « remélangeant » des échantillons issus des jeux de données originaux du NIST et est devenu une référence pour évaluer les performances des algorithmes de classification d'images.

Link to this sectionFonctionnalités clés#

  • MNIST contient 60 000 images d'entraînement et 10 000 images de test de chiffres manuscrits.
  • Le jeu de données comprend des images en niveaux de gris d'une taille de 28×28 pixels.
  • Les images sont normalisées pour tenir dans une bbox de 28×28 pixels et sont anti-crénelées, ce qui introduit des niveaux de gris.
  • MNIST est largement utilisé pour l'entraînement et le test dans le domaine de l'apprentissage automatique, en particulier pour les tâches de classification d'images.

Link to this sectionStructure du jeu de données#

Le jeu de données MNIST est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement : Ce sous-ensemble contient 60 000 images de chiffres manuscrits utilisées pour entraîner des modèles d'apprentissage automatique.
  2. Ensemble de test : Ce sous-ensemble se compose de 10 000 images utilisées pour tester et évaluer les performances des modèles entraînés.

Link to this sectionAccès au jeu de données#

  • Fichiers originaux : Télécharge les archives gzip depuis l'archive originale MNIST si tu souhaites un contrôle direct sur le prétraitement.
  • Chargeur Ultralytics : Utilise data="mnist" (ou data="mnist160" pour le sous-ensemble ci-dessous) dans ta commande et le jeu de données sera téléchargé, converti en PNG et mis en cache automatiquement.

Chaque image du jeu de données est étiquetée avec le chiffre correspondant (0-9), ce qui en fait un jeu de données d'apprentissage supervisé idéal pour les tâches de classification.

Link to this sectionExtended MNIST (EMNIST)#

Extended MNIST (EMNIST) est un jeu de données plus récent développé et publié par le NIST pour succéder à MNIST. Alors que MNIST ne comprenait que des images de chiffres manuscrits, EMNIST inclut toutes les images de la base de données spéciale 19 du NIST, qui est une vaste base de données de lettres manuscrites majuscules et minuscules ainsi que de chiffres. Les images dans EMNIST ont été converties au même format de 28×28 pixels, par le même processus, que les images MNIST. Par conséquent, les outils qui fonctionnent avec le jeu de données MNIST, plus ancien et plus petit, fonctionneront probablement sans modification avec EMNIST.

Link to this sectionApplications#

Le jeu de données MNIST est largement utilisé pour entraîner et évaluer des modèles de deep learning dans des tâches de classification d'images, telles que les Convolutional Neural Networks (CNN), les Support Vector Machines (SVM) et divers autres algorithmes d'apprentissage automatique. Le format simple et bien structuré du jeu de données en fait une ressource essentielle pour les chercheurs et les praticiens dans le domaine de l'apprentissage automatique et de la computer vision.

Quelques applications courantes incluent :

  • Évaluation comparative de nouveaux algorithmes de classification
  • Objectifs pédagogiques pour enseigner les concepts d'apprentissage automatique
  • Prototypage de systèmes de reconnaissance d'images
  • Test de techniques d'optimisation de modèles

Link to this sectionUtilisation#

Pour entraîner un modèle CNN sur le jeu de données MNIST pendant 100 epochs avec une taille d'image de 28×28, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Training.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionExemples d'images et annotations#

Le jeu de données MNIST contient des images en niveaux de gris de chiffres manuscrits, offrant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images du jeu de données :

Exemples du jeu de données de classification de chiffres manuscrits MNIST

L'exemple met en évidence la variété et la complexité des chiffres manuscrits du jeu de données MNIST, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de classification d'images robustes.

Link to this sectionCitations et remerciements#

Si tu utilises le jeu de données MNIST dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Nous tenons à remercier Yann LeCun, Corinna Cortes et Christopher J.C. Burges pour avoir créé et maintenu le jeu de données MNIST en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en computer vision. Pour plus d'informations sur le jeu de données MNIST et ses créateurs, visite le site web du jeu de données MNIST.

Link to this sectionTests rapides MNIST160#

Besoin d'un test de régression ultra-rapide ? Ultralytics expose également data="mnist160", une tranche de 160 images contenant les huit premières images de chaque chiffre (0-9) issues à la fois des splits d'entraînement et de test. Elle reflète la structure des répertoires MNIST, tu peux donc échanger les jeux de données sans changer aucun autre argument :

Exemple d'entraînement avec MNIST160
yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Utilise ce sous-ensemble pour tes pipelines CI ou tes vérifications de bon fonctionnement avant de t'engager sur le jeu de données complet de 70 000 images.

Link to this sectionFAQ#

Link to this sectionQu'est-ce que le jeu de données MNIST et pourquoi est-il important en apprentissage automatique ?#

Le jeu de données MNIST, ou Modified National Institute of Standards and Technology, est une collection largement utilisée de chiffres manuscrits conçue pour entraîner et tester des systèmes de classification d'images. Il inclut 60 000 images d'entraînement et 10 000 images de test, toutes en niveaux de gris et d'une taille de 28×28 pixels. L'importance du jeu de données réside dans son rôle de référence standard pour évaluer les algorithmes de classification d'images, aidant les chercheurs et les ingénieurs à comparer les méthodes et à suivre les progrès dans le domaine.

Link to this sectionComment puis-je utiliser Ultralytics YOLO pour entraîner un modèle sur le jeu de données MNIST ?#

Pour entraîner un modèle sur le jeu de données MNIST en utilisant Ultralytics YOLO, tu peux suivre ces étapes :

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Pour une liste détaillée des arguments d'entraînement disponibles, consulte la page Training.

Link to this sectionQuelle est la différence entre les jeux de données MNIST et EMNIST ?#

Le jeu de données MNIST contient uniquement des chiffres manuscrits, alors que le jeu de données Extended MNIST (EMNIST) inclut à la fois des chiffres ainsi que des lettres majuscules et minuscules. EMNIST a été développé comme successeur de MNIST et utilise le même format de 28×28 pixels pour les images, le rendant compatible avec les outils et modèles conçus pour le jeu de données MNIST original. Cette gamme plus large de caractères dans EMNIST le rend utile pour une variété plus étendue d'applications d'apprentissage automatique.

Link to this sectionPuis-je utiliser Ultralytics Platform pour entraîner des modèles sur des jeux de données personnalisés comme MNIST ?#

Oui, tu peux utiliser Ultralytics Platform pour entraîner des modèles sur des jeux de données personnalisés comme MNIST. Ultralytics Platform offre une interface conviviale pour télécharger des jeux de données, entraîner des modèles et gérer des projets sans nécessiter de connaissances approfondies en codage. Pour plus de détails sur la façon de commencer, consulte la page Ultralytics Platform Quickstart.

Link to this sectionComment MNIST se compare-t-il aux autres jeux de données de classification d'images ?#

MNIST est plus simple que de nombreux jeux de données modernes comme CIFAR-10 ou ImageNet, ce qui le rend idéal pour les débutants et les expérimentations rapides. Bien que des jeux de données plus complexes offrent de plus grands défis avec des images en couleur et des catégories d'objets diverses, MNIST reste précieux pour sa simplicité, la petite taille de ses fichiers et sa signification historique dans le développement des algorithmes d'apprentissage automatique. Pour des tâches de classification plus avancées, envisage d'utiliser Fashion-MNIST, qui conserve la même structure mais propose des articles vestimentaires au lieu de chiffres.

Commentaires