Skip to content

Ensemble de données CIFAR-10

L'ensemble de données CIFAR-10 (Canadian Institute For Advanced Research) est une collection d'images largement utilisée pour les algorithmes d'apprentissage automatique et de vision par ordinateur. Il a été développé par des chercheurs de l'institut CIFAR et se compose de 60 000 images couleur 32x32 réparties en 10 classes différentes.



Regarde : Comment former un modèle de classification d'images avec l'ensemble de données CIFAR-10 à l'aide de Ultralytics YOLOv8

Caractéristiques principales

  • L'ensemble de donnĂ©es CIFAR-10 se compose de 60 000 images, rĂ©parties en 10 classes.
  • Chaque classe contient 6 000 images, rĂ©parties en 5 000 pour la formation et 1 000 pour le test.
  • Les images sont colorĂ©es et ont une taille de 32x32 pixels.
  • Les 10 classes diffĂ©rentes reprĂ©sentent des avions, des voitures, des oiseaux, des chats, des cerfs, des chiens, des grenouilles, des chevaux, des bateaux et des camions.
  • CIFAR-10 est couramment utilisĂ© pour la formation et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Structure de l'ensemble de données

L'ensemble de données CIFAR-10 est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Applications

L'ensemble de données CIFAR-10 est largement utilisé pour la formation et l'évaluation de modèles d'apprentissage profond dans les tâches de classification d'images, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité de l'ensemble de données en termes de classes et la présence d'images en couleur en font un ensemble de données bien rempli pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 pour 100 époques avec une taille d'image de 32x32, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Exemples d'images et d'annotations

L'ensemble de données CIFAR-10 contient des images en couleur de divers objets, ce qui constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des objets de l'ensemble de données CIFAR-10, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

Citations et remerciements

Si tu utilises le jeu de données CIFAR-10 dans tes travaux de recherche ou de développement, cite l'article suivant :

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nous tenons à remercier Alex Krizhevsky pour avoir créé et maintenu le jeu de données CIFAR-10 comme une ressource précieuse pour la communauté de recherche sur l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations sur l'ensemble de données CIFAR-10 et son créateur, visite le site Web de l'ensemble de données CIFAR-10.

FAQ

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 ?

Pour entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 à l'aide de Ultralytics, tu peux suivre les exemples fournis pour Python et CLI. Voici un exemple de base pour entraîner ton modèle pour 100 époques avec une taille d'image de 32x32 pixels :

Exemple

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Pour plus de détails, reporte-toi à la page de formation du modèle.

Quelles sont les principales caractéristiques de l'ensemble de données CIFAR-10 ?

L'ensemble de données CIFAR-10 se compose de 60 000 images couleur réparties en 10 classes. Chaque classe contient 6 000 images, dont 5 000 pour la formation et 1 000 pour le test. Les images ont une taille de 32x32 pixels et varient selon les catégories suivantes :

  • Avions
  • Voitures
  • Oiseaux
  • Chats
  • Chevreuil
  • Chiens
  • Grenouilles
  • Chevaux
  • Navires
  • Camions

Cet ensemble de données diversifié est essentiel pour l'entraînement des modèles de classification d'images dans des domaines tels que l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations, visite les sections de CIFAR-10 sur la structure de l'ensemble de données et les applications.

Pourquoi utiliser l'ensemble de données CIFAR-10 pour les tâches de classification d'images ?

L'ensemble de données CIFAR-10 est un excellent point de référence pour la classification des images en raison de sa diversité et de sa structure. Il contient un mélange équilibré de 60 000 images étiquetées dans 10 catégories différentes, ce qui aide à former des modèles robustes et généralisés. Il est largement utilisé pour évaluer les modèles d'apprentissage profond, notamment les réseaux neuronaux convolutifs (CNN) et d'autres algorithmes d'apprentissage automatique. L'ensemble de données est relativement petit, ce qui le rend adapté à l'expérimentation rapide et au développement d'algorithmes. Explore ses nombreuses applications dans la section des applications.

Comment l'ensemble de données CIFAR-10 est-il structuré ?

L'ensemble de données CIFAR-10 est structuré en deux sous-ensembles principaux :

  1. Ensemble d'entraînement: Contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Consiste en 10 000 images pour tester et étalonner les modèles formés.

Chaque sous-ensemble comprend des images classées en 10 classes, dont les annotations sont facilement accessibles pour l'entraînement et l'évaluation du modèle. Pour des informations plus détaillées, reporte-toi à la section sur la structure des ensembles de données.

Comment puis-je citer l'ensemble de données CIFAR-10 dans ma recherche ?

Si tu utilises le jeu de données CIFAR-10 dans tes projets de recherche ou de développement, assure-toi de citer l'article suivant :

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Remercier les créateurs de l'ensemble de données permet de soutenir la recherche et le développement continus dans ce domaine. Pour plus de détails, voir la section citations et remerciements.

Quels sont les exemples pratiques d'utilisation de l'ensemble de données CIFAR-10 ?

L'ensemble de données CIFAR-10 est souvent utilisé pour entraîner des modèles de classification d'images, tels que les réseaux neuronaux convolutifs (CNN) et les machines à vecteurs de support (SVM). Ces modèles peuvent être employés dans diverses tâches de vision par ordinateur, notamment la détection d'objets, la reconnaissance d'images et l'étiquetage automatisé. Pour voir quelques exemples pratiques, consulte les extraits de code dans la section utilisation.



Créé le 2023-11-12, Mis à jour le 2024-07-12
Auteurs : RizwanMunawar (1), glenn-jocher (6)

Commentaires