Skip to content

Ensemble de données Caltech-256

L'ensemble de données Caltech-256 est une vaste collection d'images utilisées pour des tâches de classification d'objets. Il contient environ 30 000 images réparties en 257 catégories (256 catégories d'objets et 1 catégorie d'arrière-plan). Les images sont soigneusement sélectionnées et annotées afin de fournir une référence difficile et diversifiée pour les algorithmes de reconnaissance d'objets.

Caractéristiques principales

  • L'ensemble de données Caltech-256 comprend environ 30 000 images couleur réparties en 257 catégories.
  • Chaque catégorie contient un minimum de 80 images.
  • Les catégories englobent une grande variété d'objets du monde réel, notamment des animaux, des véhicules, des articles ménagers et des personnes.
  • Les images sont de taille et de résolution variables.
  • Caltech-256 est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.

Structure de l'ensemble de données

Comme Caltech-101, l'ensemble de données Caltech-256 n'a pas de division formelle entre les ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres séparations en fonction de leurs besoins spécifiques. Une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement et les images restantes pour les tests.

Applications

L'ensemble de données Caltech-256 est largement utilisé pour la formation et l'évaluation de modèles d'apprentissage profond dans les tâches de reconnaissance d'objets, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. Son ensemble diversifié de catégories et ses images de haute qualité en font un jeu de données inestimable pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle YOLO sur l'ensemble de données Caltech-256 pendant 100 époques, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech256', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Exemples d'images et d'annotations

L'ensemble de données Caltech-256 contient des images couleur de haute qualité de divers objets, ce qui constitue un ensemble de données complet pour les tâches de reconnaissance d'objets. Voici quelques exemples d'images tirées de l'ensemble de données(crédit) :

Image de l'échantillon du jeu de données

L'exemple présente la diversité et la complexité des objets de l'ensemble de données Caltech-256, soulignant l'importance d'un ensemble de données varié pour entraîner des modèles de reconnaissance d'objets robustes.

Citations et remerciements

Si tu utilises le jeu de données Caltech-256 dans tes travaux de recherche ou de développement, cite l'article suivant :

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Nous tenons à remercier Gregory Griffin, Alex Holub et Pietro Perona pour la création et la maintenance de l'ensemble de données Caltech-256, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données Caltech-256

Le jeu de données Caltech-256 et ses créateurs, visite le site web du jeu de données Caltech-256.



Créé le 2023-11-12, Mis à jour le 2023-11-22
Auteurs : glenn-jocher (3)

Commentaires