Skip to content

Ensemble de données CIFAR-10

The CIFAR-10 (Canadian Institute For Advanced Research) dataset is a collection of images used widely for machine learning and computer vision algorithms. It was developed by researchers at the CIFAR institute and consists of 60,000 32x32 color images in 10 different classes.



Regarde : How to Train an Classification des images Model with CIFAR-10 Dataset using Ultralytics YOLO11

Caractéristiques principales

  • L'ensemble de données CIFAR-10 se compose de 60 000 images, réparties en 10 classes.
  • Chaque classe contient 6 000 images, réparties en 5 000 pour la formation et 1 000 pour le test.
  • Les images sont colorées et ont une taille de 32x32 pixels.
  • Les 10 classes différentes représentent des avions, des voitures, des oiseaux, des chats, des cerfs, des chiens, des grenouilles, des chevaux, des bateaux et des camions.
  • CIFAR-10 est couramment utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Structure de l'ensemble de données

L'ensemble de données CIFAR-10 est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Ce sous-ensemble se compose de 10 000 images utilisées pour tester et étalonner les modèles formés.

Applications

The CIFAR-10 dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The diversity of the dataset in terms of classes and the presence of color images make it a well-rounded dataset for research and development in the field of machine learning and computer vision.

Utilisation

Pour entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 pour 100 époques avec une taille d'image de 32x32, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Exemples d'images et d'annotations

L'ensemble de données CIFAR-10 contient des images en couleur de divers objets, ce qui constitue un ensemble de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des objets de l'ensemble de données CIFAR-10, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

Citations et remerciements

Si tu utilises le jeu de données CIFAR-10 dans tes travaux de recherche ou de développement, cite l'article suivant :

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We would like to acknowledge Alex Krizhevsky for creating and maintaining the CIFAR-10 dataset as a valuable resource for the machine learning and computer vision research community. For more information about the CIFAR-10 dataset and its creator, visit the CIFAR-10 dataset website.

FAQ

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données CIFAR-10 ?

To train a YOLO model on the CIFAR-10 dataset using Ultralytics, you can follow the examples provided for both Python and CLI. Here is a basic example to train your model for 100 epochs with an image size of 32x32 pixels:

Exemple

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Pour plus de détails, reporte-toi à la page de formation du modèle.

Quelles sont les principales caractéristiques de l'ensemble de données CIFAR-10 ?

L'ensemble de données CIFAR-10 se compose de 60 000 images couleur réparties en 10 classes. Chaque classe contient 6 000 images, dont 5 000 pour la formation et 1 000 pour le test. Les images ont une taille de 32x32 pixels et varient selon les catégories suivantes :

  • Avions
  • Voitures
  • Oiseaux
  • Chats
  • Chevreuil
  • Chiens
  • Grenouilles
  • Chevaux
  • Navires
  • Camions

Cet ensemble de données diversifié est essentiel pour l'entraînement des modèles de classification d'images dans des domaines tels que l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations, visite les sections de CIFAR-10 sur la structure de l'ensemble de données et les applications.

Pourquoi utiliser l'ensemble de données CIFAR-10 pour les tâches de classification d'images ?

The CIFAR-10 dataset is an excellent benchmark for image classification due to its diversity and structure. It contains a balanced mix of 60,000 labeled images across 10 different categories, which helps in training robust and generalized models. It is widely used for evaluating deep learning models, including Convolutional Neural Networks (CNNs) and other machine learning algorithms. The dataset is relatively small, making it suitable for quick experimentation and algorithm development. Explore its numerous applications in the applications section.

Comment l'ensemble de données CIFAR-10 est-il structuré ?

L'ensemble de données CIFAR-10 est structuré en deux sous-ensembles principaux :

  1. Ensemble d'entraînement: Contient 50 000 images utilisées pour l'entraînement des modèles d'apprentissage automatique.
  2. Ensemble de test: Consiste en 10 000 images pour tester et étalonner les modèles formés.

Chaque sous-ensemble comprend des images classées en 10 classes, dont les annotations sont facilement accessibles pour l'entraînement et l'évaluation du modèle. Pour des informations plus détaillées, reporte-toi à la section sur la structure des ensembles de données.

Comment puis-je citer l'ensemble de données CIFAR-10 dans ma recherche ?

Si tu utilises le jeu de données CIFAR-10 dans tes projets de recherche ou de développement, assure-toi de citer l'article suivant :

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Remercier les créateurs de l'ensemble de données permet de soutenir la recherche et le développement continus dans ce domaine. Pour plus de détails, voir la section citations et remerciements.

Quels sont les exemples pratiques d'utilisation de l'ensemble de données CIFAR-10 ?

The CIFAR-10 dataset is often used for training image classification models, such as Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs). These models can be employed in various computer vision tasks including object detection, image recognition, and automated tagging. To see some practical examples, check the code snippets in the usage section.

📅 Created 11 months ago ✏️ Updated 22 days ago

Commentaires