Ensemble de données CIFAR-10
Le jeu de données CIFAR-10 (Canadian Institute For Advanced Research) est une collection d'images largement utilisée pour les algorithmes d'apprentissage automatique et de vision par ordinateur. Il a été développé par des chercheurs de l'institut CIFAR et se compose de 60 000 images couleur de 32x32 pixels réparties en 10 classes différentes.
Regarder : Comment entraîner un Classification d'images Modèle avec le jeu de données CIFAR-10 utilisant Ultralytics YOLO11
Principales caractéristiques
- Le jeu de données CIFAR-10 est constitué de 60 000 images, réparties en 10 classes.
- Chaque classe contient 6 000 images, réparties en 5 000 pour l'entraînement et 1 000 pour les tests.
- Les images sont en couleur et de taille 32x32 pixels.
- Les 10 classes différentes représentent des avions, des voitures, des oiseaux, des chats, des cerfs, des chiens, des grenouilles, des chevaux, des navires et des camions.
- CIFAR-10 est couramment utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Structure du jeu de données
L'ensemble de données CIFAR-10 est divisé en deux sous-ensembles :
- Ensemble d'entraînement : Ce sous-ensemble contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
- Ensemble de test : Ce sous-ensemble est constitué de 10 000 images utilisées pour tester et évaluer les modèles entraînés.
Applications
L'ensemble de données CIFAR-10 est largement utilisé pour l'entraînement et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, telles que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité de l'ensemble de données en termes de classes et la présence d'images en couleur en font un ensemble de données complet pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Utilisation
Pour entraîner un modèle YOLO sur le jeu de données CIFAR-10 pendant 100 epochs avec une taille d'image de 32x32, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Training du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Images et annotations d'exemple
L'ensemble de données CIFAR-10 contient des images couleur de divers objets, fournissant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images de l'ensemble de données :
Cet exemple illustre la variété et la complexité des objets dans l'ensemble de données CIFAR-10, soulignant l'importance d'un ensemble de données diversifié pour la formation de modèles robustes de classification d'images.
Citations et remerciements
Si vous utilisez l'ensemble de données CIFAR-10 dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Nous tenons à remercier Alex Krizhevsky pour la création et la maintenance de l'ensemble de données CIFAR-10 en tant que ressource précieuse pour la communauté de recherche sur l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations sur l'ensemble de données CIFAR-10 et son créateur, consultez le site Web de l'ensemble de données CIFAR-10.
FAQ
Comment puis-je entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 ?
Pour entraîner un modèle YOLO sur le jeu de données CIFAR-10 à l'aide d'Ultralytics, vous pouvez suivre les exemples fournis pour python et la CLI. Voici un exemple de base pour entraîner votre modèle pendant 100 epochs avec une taille d'image de 32x32 pixels :
Exemple
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Pour plus de détails, consultez la page Formation du modèle.
Quelles sont les principales caractéristiques de l'ensemble de données CIFAR-10 ?
L'ensemble de données CIFAR-10 se compose de 60 000 images couleur divisées en 10 classes. Chaque classe contient 6 000 images, dont 5 000 pour l'entraînement et 1 000 pour les tests. Les images ont une taille de 32x32 pixels et varient selon les catégories suivantes :
- Avions
- Voitures
- Oiseaux
- Chats
- Cerf
- Chiens
- Grenouilles
- Chevaux
- Navires
- Camions
Ce jeu de données diversifié est essentiel pour l'entraînement des modèles de classification d'images dans des domaines tels que l'apprentissage automatique et la vision artificielle. Pour plus d'informations, consultez les sections CIFAR-10 sur la structure du jeu de données et les applications.
Pourquoi utiliser l'ensemble de données CIFAR-10 pour les tâches de classification d'images ?
L'ensemble de données CIFAR-10 est une excellente référence pour la classification d'images en raison de sa diversité et de sa structure. Il contient un mélange équilibré de 60 000 images étiquetées dans 10 catégories différentes, ce qui aide à former des modèles robustes et généralisés. Il est largement utilisé pour évaluer les modèles d'apprentissage profond, y compris les réseaux neuronaux convolutionnels (CNN) et d'autres algorithmes d'apprentissage automatique. L'ensemble de données est relativement petit, ce qui le rend adapté à l'expérimentation rapide et au développement d'algorithmes. Explorez ses nombreuses applications dans la section applications.
Comment l'ensemble de données CIFAR-10 est-il structuré ?
L'ensemble de données CIFAR-10 est structuré en deux sous-ensembles principaux :
- Ensemble d'entraînement : Contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
- Ensemble de test : Se compose de 10 000 images pour tester et évaluer les modèles entraînés.
Chaque sous-ensemble comprend des images classées en 10 classes, avec leurs annotations facilement disponibles pour l'entraînement et l'évaluation du modèle. Pour plus d'informations, consultez la section structure de l'ensemble de données.
Comment puis-je citer l'ensemble de données CIFAR-10 dans mes recherches ?
Si vous utilisez l'ensemble de données CIFAR-10 dans vos projets de recherche ou de développement, assurez-vous de citer l'article suivant :
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
La reconnaissance des créateurs de l'ensemble de données contribue à soutenir la recherche et le développement continus dans le domaine. Pour plus de détails, consultez la section citations et remerciements.
Quels sont quelques exemples pratiques d'utilisation de l'ensemble de données CIFAR-10 ?
L'ensemble de données CIFAR-10 est souvent utilisé pour entraîner des modèles de classification d'images, tels que les réseaux neuronaux convolutifs (CNN) et les machines à vecteurs de support (SVM). Ces modèles peuvent être utilisés dans diverses tâches de vision par ordinateur, notamment la détection d'objets, la reconnaissance d'images et le marquage automatisé. Pour voir quelques exemples pratiques, consultez les extraits de code dans la section utilisation.