No license

Link to this sectionJeu de données CIFAR-10#

Le dataset CIFAR-10 (Canadian Institute For Advanced Research) est un benchmark classique de classification d'images composé de 60 000 images couleur 32x32 réparties équitablement entre 10 classes : avion, automobile, oiseau, chat, cerf, chien, grenouille, cheval, navire et camion. Il est fourni avec une répartition prédéfinie de 50 000 images d'entraînement et 10 000 images de test (6 000 par classe), ce qui en fait un point de départ léger et bien équilibré pour entraîner et évaluer des modèles de classification. Pour un défi plus granulaire, consulte le dataset associé CIFAR-100.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionFonctionnalités clés#

CIFAR-10 contient 60 000 images couleur de 32x32 pixels, divisées équitablement en 10 classes.
Chaque classe contient exactement 6 000 images — 5 000 pour l'entraînement et 1 000 pour le test — le dataset est donc parfaitement équilibré.
Les 10 classes sont : avion, automobile, oiseau, chat, cerf, chien, grenouille, cheval, navire et camion.
Le dataset est fourni avec une répartition entraînement/test prédéfinie, donc aucune séparation manuelle ou automatique n'est requise.
CIFAR-10 est un benchmark standard pour la recherche en classification d'images et en reconnaissance d'objets.

Link to this sectionStructure du jeu de données#

CIFAR-10 est fourni avec une répartition officielle prédéfinie, aucune séparation manuelle ou automatique n'est donc nécessaire :

Classes : 10 (avion, automobile, oiseau, chat, cerf, chien, grenouille, cheval, navire, camion)
Nombre total d'images : 60 000 (couleur 32x32)
Ensemble d'entraînement : 50 000 images (5 000 par classe)
Ensemble de test : 10 000 images (1 000 par classe)

Split de validation

CIFAR-10 ne possède pas de dossier de validation distinct, c'est pourquoi Ultralytics utilise par défaut l'ensemble de test de 10 000 images comme répartition de validation pendant l'entraînement.

Link to this sectionApplications#

CIFAR-10 est largement utilisé pour entraîner et évaluer des modèles de classification d'images, des Réseaux de neurones convolutifs (CNN) et Machines à vecteurs de support (SVM) classiques aux architectures profondes modernes. Sa petite taille d'image et ses classes équilibrées le rendent idéal pour l'expérimentation rapide, le benchmarking de nouveaux algorithmes et l'enseignement des fondamentaux de la vision par ordinateur.

Link to this sectionUtilisation#

Entraîne un modèle YOLO sur CIFAR-10 pendant 100 époques avec une taille d'image de 32. Pour la liste complète des arguments disponibles, consulte la page Entraînement et le guide de tâche classification d'images.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionExemples d'images et annotations#

Le dataset CIFAR-10 contient des images couleur d'objets variés, offrant un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images issues du dataset :

Exemples de jeu de données de classification d'images CIFAR-10

Les échantillons montrent la diversité des objets dans le dataset CIFAR-10, soulignant l'importance d'un dataset varié pour entraîner des modèles de classification d'images robustes.

Link to this sectionCitations et remerciements#

Si tu utilises le jeu de données CIFAR-10 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nous tenons à remercier Alex Krizhevsky pour la création et la maintenance du dataset CIFAR-10 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le dataset CIFAR-10 et son créateur, visite le site web du dataset CIFAR-10.

Link to this sectionFAQ#

Link to this sectionÀ quoi sert le dataset CIFAR-10 en apprentissage automatique ?#

Le dataset CIFAR-10 est largement utilisé pour entraîner et évaluer des modèles de classification d'images et de reconnaissance d'objets. Il contient 60 000 images couleur 32x32 réparties équitablement entre 10 classes, et sa petite taille ainsi que ses classes équilibrées en font un benchmark rapide et fiable pour des algorithmes tels que les Réseaux de neurones convolutifs (CNN) et les Machines à vecteurs de support (SVM).

Link to this sectionComment puis-je entraîner un modèle Ultralytics YOLO sur le dataset CIFAR-10 ?#

Pour entraîner un modèle Ultralytics YOLO sur CIFAR-10, utilise les extraits de code ci-dessous. Le dataset se télécharge automatiquement lors de la première utilisation. Pour une liste complète des arguments, consulte la page Entraînement du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionCombien de classes le dataset CIFAR-10 possède-t-il ?#

CIFAR-10 possède 10 classes — avion, automobile, oiseau, chat, cerf, chien, grenouille, cheval, navire et camion — avec exactement 6 000 images chacune, pour un total de 60 000 images. Les classes sont mutuellement exclusives et parfaitement équilibrées, sans chevauchement entre les catégories.

Link to this sectionComment le dataset CIFAR-10 est-il divisé en ensembles d'entraînement et de test ?#

CIFAR-10 est fourni avec une répartition prédéfinie de 50 000 images d'entraînement et 10 000 images de test, avec exactement 5 000 images d'entraînement et 1 000 images de test par classe. Contrairement aux datasets de classification basés sur des dossiers qu'Ultralytics divise automatiquement, la répartition officielle de CIFAR-10 est utilisée telle quelle, et l'ensemble de test sert par défaut de répartition de validation pendant l'entraînement.

Link to this sectionPuis-je utiliser Ultralytics Platform pour entraîner des modèles sur le dataset CIFAR-10 ?#

Oui. Ultralytics Platform te permet de gérer tes datasets, d'entraîner des modèles de classification d'images et de les déployer sans coder de manière intensive. C'est un moyen pratique d'exécuter des expériences CIFAR-10 dans le cloud, et tu peux explorer d'autres options dans notre présentation des datasets de classification.

Contributeurs

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Créé 12 nov. 2023Mis à jour il y a 3 jours