Jeu de données CIFAR-100

Le jeu de données CIFAR-100 (Canadian Institute For Advanced Research) est une extension significative du jeu de données CIFAR-10, composé de 60 000 images couleur 32x32 réparties en 100 classes différentes. Il a été développé par des chercheurs de l'institut CIFAR, offrant un jeu de données plus exigeant pour des tâches plus complexes d'apprentissage automatique et de vision par ordinateur.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Fonctionnalités clés

  • Le jeu de données CIFAR-100 se compose de 60 000 images, divisées en 100 classes.
  • Chaque classe contient 600 images, réparties en 500 pour l'entraînement et 100 pour le test.
  • Les images sont en couleur et ont une taille de 32x32 pixels.
  • Les 100 classes différentes sont regroupées en 20 catégories grossières pour une classification de plus haut niveau.
  • Le CIFAR-100 est couramment utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Structure du jeu de données

Le jeu de données CIFAR-100 est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement : Ce sous-ensemble contient 50 000 images utilisées pour entraîner des modèles d'apprentissage automatique.
  2. Ensemble de test : Ce sous-ensemble se compose de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Applications

Le jeu de données CIFAR-100 est largement utilisé pour entraîner et évaluer des modèles d'apprentissage profond dans des tâches de classification d'images, telles que les réseaux de neurones convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité du jeu de données en termes de classes et la présence d'images couleur en font un jeu de données plus complet et stimulant pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle YOLO sur le jeu de données CIFAR-100 pendant 100 époques avec une taille d'image de 32x32, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Exemples d'images et d'annotations

Le jeu de données CIFAR-100 contient des images couleur de divers objets, offrant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images du jeu de données :

Échantillons du jeu de données de classification d'images CIFAR-100

L'exemple met en évidence la variété et la complexité des objets dans le jeu de données CIFAR-100, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de classification d'images robustes.

Citations et remerciements

Si tu utilises le jeu de données CIFAR-100 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nous tenons à remercier Alex Krizhevsky pour avoir créé et maintenu le jeu de données CIFAR-100 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données CIFAR-100 et son créateur, visite le site web du jeu de données CIFAR-100.

FAQ

Qu'est-ce que le jeu de données CIFAR-100 et pourquoi est-il important ?

Le jeu de données CIFAR-100 est une vaste collection de 60 000 images couleur 32x32 classées en 100 classes. Développé par le Canadian Institute For Advanced Research (CIFAR), il fournit un jeu de données stimulant, idéal pour des tâches complexes d'apprentissage automatique et de vision par ordinateur. Son importance réside dans la diversité des classes et la petite taille des images, ce qui en fait une ressource précieuse pour l'entraînement et le test de modèles d'apprentissage profond, comme les réseaux de neurones convolutifs (CNN), en utilisant des frameworks tels qu'Ultralytics YOLO.

Comment puis-je entraîner un modèle YOLO sur le jeu de données CIFAR-100 ?

Tu peux entraîner un modèle YOLO sur le jeu de données CIFAR-100 en utilisant Python ou des commandes CLI. Voici comment faire :

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Pour une liste complète des arguments disponibles, merci de consulter la page Entraînement du modèle.

Quelles sont les principales applications du jeu de données CIFAR-100 ?

Le jeu de données CIFAR-100 est largement utilisé dans l'entraînement et l'évaluation de modèles d'apprentissage profond pour la classification d'images. Son ensemble diversifié de 100 classes, regroupées en 20 catégories grossières, offre un environnement exigeant pour tester des algorithmes tels que les réseaux de neurones convolutifs (CNN), les machines à vecteurs de support (SVM) et diverses autres approches d'apprentissage automatique. Ce jeu de données est une ressource clé dans la recherche et le développement au sein des domaines de l'apprentissage automatique et de la vision par ordinateur, notamment pour les tâches de reconnaissance d'objets et de classification.

Comment le jeu de données CIFAR-100 est-il structuré ?

Le jeu de données CIFAR-100 est divisé en deux sous-ensembles principaux :

  1. Ensemble d'entraînement : Contient 50 000 images utilisées pour entraîner des modèles d'apprentissage automatique.
  2. Jeu de test : Composé de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Chacune des 100 classes contient 600 images, avec 500 images pour l'entraînement et 100 pour le test, ce qui le rend particulièrement adapté à la recherche académique et industrielle rigoureuse.

Où puis-je trouver des exemples d'images et d'annotations du jeu de données CIFAR-100 ?

Le jeu de données CIFAR-100 comprend une variété d'images couleur de divers objets, ce qui en fait un jeu de données structuré pour les tâches de classification d'images. Tu peux consulter la page de documentation pour voir des exemples d'images et d'annotations. Ces exemples soulignent la diversité et la complexité du jeu de données, importantes pour entraîner des modèles de classification d'images robustes. Pour plus de jeux de données adaptés aux tâches de classification, jette un œil à l'aperçu des jeux de données de classification d'Ultralytics.

Commentaires