Jeu de données CIFAR-100
Le jeu de données CIFAR-100 (Canadian Institute For Advanced Research) est une extension significative du jeu de données CIFAR-10, composé de 60 000 images couleur de 32x32 pixels réparties en 100 classes différentes. Il a été développé par des chercheurs de l'institut CIFAR, offrant un jeu de données plus complexe pour des tâches d'apprentissage automatique et de vision par ordinateur plus élaborées.
Regarder : Comment entraîner Ultralytics YOLO11 sur CIFAR-100 | Tutoriel pas à pas de classification d'images 🚀
Principales caractéristiques
- Le jeu de données CIFAR-100 est constitué de 60 000 images, réparties en 100 classes.
- Chaque classe contient 600 images, divisées en 500 pour l'entraînement et 100 pour les tests.
- Les images sont en couleur et de taille 32x32 pixels.
- Les 100 classes différentes sont regroupées en 20 catégories grossières pour une classification de niveau supérieur.
- CIFAR-100 est couramment utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Structure du jeu de données
Le jeu de données CIFAR-100 est divisé en deux sous-ensembles :
- Ensemble d'entraînement : Ce sous-ensemble contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
- Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.
Applications
L'ensemble de données CIFAR-100 est largement utilisé pour l'entraînement et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, telles que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité de l'ensemble de données en termes de classes et la présence d'images en couleur en font un ensemble de données plus difficile et plus complet pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Utilisation
Pour entraîner un modèle YOLO sur le jeu de données CIFAR-100 pendant 100 epochs avec une taille d'image de 32x32, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
Images et annotations d'exemple
L'ensemble de données CIFAR-100 contient des images en couleur de divers objets, fournissant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images de l'ensemble de données :
L'exemple illustre la variété et la complexité des objets dans le jeu de données CIFAR-100, soulignant l'importance d'un jeu de données diversifié pour l'entraînement de modèles de classification d'images robustes.
Citations et remerciements
Si vous utilisez le jeu de données CIFAR-100 dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Nous tenons à remercier Alex Krizhevsky pour la création et la maintenance de l'ensemble de données CIFAR-100, une ressource précieuse pour la communauté de la recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données CIFAR-100 et son créateur, consultez le site web de l'ensemble de données CIFAR-100.
FAQ
Qu'est-ce que l'ensemble de données CIFAR-100 et pourquoi est-il important ?
L'ensemble de données CIFAR-100 est une vaste collection de 60 000 images couleur de 32x32 pixels classées en 100 classes. Développé par l'Institut canadien de recherches avancées (CIFAR), il fournit un ensemble de données stimulant, idéal pour les tâches complexes d'apprentissage automatique et de vision par ordinateur. Son importance réside dans la diversité des classes et la petite taille des images, ce qui en fait une ressource précieuse pour l'entraînement et le test de modèles d'apprentissage profond, tels que les réseaux neuronaux convolutionnels (CNN), à l'aide de frameworks tels que Ultralytics YOLO.
Comment puis-je entraîner un modèle YOLO sur l'ensemble de données CIFAR-100 ?
Vous pouvez entraîner un modèle YOLO sur le jeu de données CIFAR-100 en utilisant des commandes Python ou CLI. Voici comment :
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
Pour une liste complète des arguments disponibles, veuillez consulter la page Formation du modèle.
Quelles sont les principales applications du jeu de données CIFAR-100 ?
L'ensemble de données CIFAR-100 est largement utilisé dans l'entraînement et l'évaluation des modèles d'apprentissage profond pour la classification d'images. Son ensemble diversifié de 100 classes, regroupées en 20 catégories grossières, offre un environnement stimulant pour tester des algorithmes tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et diverses autres approches d'apprentissage automatique. Cet ensemble de données est une ressource clé dans la recherche et le développement dans les domaines de l'apprentissage automatique et de la vision par ordinateur, en particulier pour les tâches de reconnaissance d'objets et de classification.
Comment le jeu de données CIFAR-100 est-il structuré ?
Le jeu de données CIFAR-100 est divisé en deux sous-ensembles principaux :
- Ensemble d'entraînement : Contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
- Ensemble de test : Comprend 10 000 images utilisées pour tester et évaluer les modèles entraînés.
Chacune des 100 classes contient 600 images, dont 500 pour l'entraînement et 100 pour les tests, ce qui la rend particulièrement adaptée à la recherche académique et industrielle rigoureuse.
Où puis-je trouver des exemples d'images et d'annotations du jeu de données CIFAR-100 ?
L'ensemble de données CIFAR-100 comprend une variété d'images en couleur de divers objets, ce qui en fait un ensemble de données structuré pour les tâches de classification d'images. Vous pouvez consulter la page de documentation pour voir des sample_images et des annotations. Ces exemples mettent en évidence la diversité et la complexité de l'ensemble de données, importantes pour l'entraînement de modèles de classification d'images robustes. Pour plus d'ensembles de données adaptés aux tâches de classification, consultez la présentation des ensembles de données de classification d'Ultralytics.