Jeu de données CIFAR-10

Le jeu de données CIFAR-10 (Canadian Institute For Advanced Research) est une collection d'images largement utilisée pour les algorithmes d'apprentissage automatique et de vision par ordinateur. Il a été développé par des chercheurs de l'institut CIFAR et se compose de 60 000 images couleur de 32x32 pixels réparties en 10 classes différentes.



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

Fonctionnalités clés

  • Le jeu de données CIFAR-10 se compose de 60 000 images, divisées en 10 classes.
  • Chaque classe contient 6 000 images, réparties en 5 000 pour l'entraînement et 1 000 pour le test.
  • Les images sont en couleur et ont une taille de 32x32 pixels.
  • Les 10 classes différentes représentent des avions, des voitures, des oiseaux, des chats, des cerfs, des chiens, des grenouilles, des chevaux, des navires et des camions.
  • CIFAR-10 est couramment utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Structure du jeu de données

Le jeu de données CIFAR-10 est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement : Ce sous-ensemble contient 50 000 images utilisées pour entraîner des modèles d'apprentissage automatique.
  2. Ensemble de test : Ce sous-ensemble se compose de 10 000 images utilisées pour tester et évaluer les modèles entraînés.

Applications

Le jeu de données CIFAR-10 est largement utilisé pour entraîner et évaluer des modèles d'apprentissage profond dans des tâches de classification d'images, telles que les réseaux de neurones convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité du jeu de données en termes de classes et la présence d'images couleur en font un jeu de données complet pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle YOLO sur le jeu de données CIFAR-10 pendant 100 époques avec une taille d'image de 32x32, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Exemples d'images et d'annotations

Le jeu de données CIFAR-10 contient des images couleur de divers objets, offrant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images issues du jeu de données :

Exemples du jeu de données de classification d'images CIFAR-10

L'exemple met en évidence la variété et la complexité des objets dans le jeu de données CIFAR-10, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de classification d'images robustes.

Citations et remerciements

Si tu utilises le jeu de données CIFAR-10 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nous tenons à remercier Alex Krizhevsky pour avoir créé et maintenu le jeu de données CIFAR-10 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données CIFAR-10 et son créateur, visite le site web du jeu de données CIFAR-10.

FAQ

Comment puis-je entraîner un modèle YOLO sur le jeu de données CIFAR-10 ?

Pour entraîner un modèle YOLO sur le jeu de données CIFAR-10 en utilisant Ultralytics, tu peux suivre les exemples fournis pour Python et l'interface CLI. Voici un exemple de base pour entraîner ton modèle pendant 100 époques avec une taille d'image de 32x32 pixels :

Exemple
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Pour plus de détails, reporte-toi à la page Entraînement du modèle.

Quelles sont les principales caractéristiques du jeu de données CIFAR-10 ?

Le jeu de données CIFAR-10 se compose de 60 000 images couleur divisées en 10 classes. Chaque classe contient 6 000 images, avec 5 000 pour l'entraînement et 1 000 pour le test. Les images ont une taille de 32x32 pixels et varient selon les catégories suivantes :

  • Avions
  • Voitures
  • Oiseaux
  • Chats
  • Cerfs
  • Chiens
  • Grenouilles
  • Chevaux
  • Navires
  • Camions

Ce jeu de données diversifié est essentiel pour entraîner des modèles de classification d'images dans des domaines tels que l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations, consulte les sections sur la structure du jeu de données et les applications liées à CIFAR-10.

Pourquoi utiliser le jeu de données CIFAR-10 pour des tâches de classification d'images ?

Le jeu de données CIFAR-10 est un excellent benchmark pour la classification d'images en raison de sa diversité et de sa structure. Il contient un mélange équilibré de 60 000 images étiquetées dans 10 catégories différentes, ce qui aide à entraîner des modèles robustes et généralisés. Il est largement utilisé pour évaluer des modèles d'apprentissage profond, y compris les réseaux de neurones convolutifs (CNN) et d'autres algorithmes d'apprentissage automatique. Le jeu de données est relativement petit, ce qui le rend adapté à l'expérimentation rapide et au développement d'algorithmes. Explore ses nombreuses applications dans la section applications.

Comment le jeu de données CIFAR-10 est-il structuré ?

Le jeu de données CIFAR-10 est structuré en deux sous-ensembles principaux :

  1. Ensemble d'entraînement : Contient 50 000 images utilisées pour entraîner des modèles d'apprentissage automatique.
  2. Ensemble de test : Se compose de 10 000 images pour tester et évaluer les modèles entraînés.

Chaque sous-ensemble comprend des images classées en 10 classes, avec leurs annotations facilement disponibles pour l'entraînement et l'évaluation des modèles. Pour des informations plus détaillées, reporte-toi à la section structure du jeu de données.

Comment puis-je citer le jeu de données CIFAR-10 dans mes recherches ?

Si tu utilises le jeu de données CIFAR-10 dans tes projets de recherche ou de développement, assure-toi de citer l'article suivant :

Citation
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Reconnaître les créateurs du jeu de données contribue à soutenir la recherche et le développement continus dans le domaine. Pour plus de détails, voir la section citations et remerciements.

Quels sont quelques exemples pratiques d'utilisation du jeu de données CIFAR-10 ?

Le jeu de données CIFAR-10 est souvent utilisé pour entraîner des modèles de classification d'images, tels que les réseaux de neurones convolutifs (CNN) et les machines à vecteurs de support (SVM). Ces modèles peuvent être utilisés dans diverses tâches de vision par ordinateur, notamment la détection d'objets, la reconnaissance d'images et l'étiquetage automatisé. Pour voir quelques exemples pratiques, consulte les extraits de code dans la section utilisation.

Commentaires