Link to this sectionJeu de données Caltech-256#

Le jeu de données Caltech-256 est un benchmark classique de classification d'images composé de 30 607 images réparties dans 256 catégories d'objets plus une classe d'arrière-plan. Chaque catégorie contient au moins 80 images d'objets du monde réel — animaux, véhicules, objets ménagers et personnes — ce qui en fait un successeur plus vaste et plus exigeant de Caltech-101 pour les modèles de reconnaissance d'objets.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Fractionnement automatique des données

Caltech-256 est fourni sans séparation prédéfinie entre les ensembles d'entraînement et de validation. Les commandes d'entraînement ci-dessous le divisent automatiquement en 80 % pour l'entraînement et 20 % pour la validation, aucune préparation manuelle n'est donc nécessaire.

Link to this sectionFonctionnalités clés#

Caltech-256 contient 30 607 images en couleur réparties dans 256 catégories d'objets plus une classe d'arrière-plan 257.clutter (soit 257 dossiers de classes au total).
Les catégories couvrent une grande variété d'objets du monde réel, notamment des animaux, des véhicules, des articles ménagers et des personnes.
Chaque catégorie contient au moins 80 images, la plus importante en comptant jusqu'à environ 800 ; les tailles des classes sont donc déséquilibrées.
Les images sont de tailles et de résolutions variables.
Caltech-256 est largement utilisé pour évaluer les algorithmes de classification d'images et de reconnaissance d'objets.

Link to this sectionStructure du jeu de données#

Caltech-256 est distribué sous forme de 257 dossiers — un par classe, couvrant 256 catégories d'objets plus une classe d'arrière-plan 257.clutter — sans séparation prédéfinie entre l'entraînement et la validation. Lorsque tu lances l'entraînement, Ultralytics partitionne automatiquement les images afin que les modèles s'entraînent sur l'ensemble des 257 classes sans aucune configuration manuelle :

Classes : 257 (256 catégories d'objets + 1 arrière-plan)
Nombre total d'images : 30 607
Répartition entraînement/validation : automatique 80 % / 20 % (≈ 24 385 entraînement, ≈ 6 222 validation)
Images par classe : au moins 80 (déséquilibré, jusqu'à environ 800)

Link to this sectionApplications#

Le jeu de données Caltech-256 est largement utilisé pour entraîner et évaluer des modèles de classification d'images et de reconnaissance d'objets, y compris des réseaux de neurones convolutifs (CNNs) et des machines à vecteurs de support (SVMs). Son grand nombre de catégories et ses images de haute qualité en font un benchmark populaire pour la recherche et le prototypage en apprentissage automatique et en vision par ordinateur.

Link to this sectionUtilisation#

Entraîne un modèle YOLO sur Caltech-256 pendant 100 époques avec une taille d'image de 416. Pour obtenir la liste complète des arguments disponibles, consulte la page Entraînement et le guide de tâche pour la classification d'images.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionExemples d'images et annotations#

Le jeu de données Caltech-256 contient des images en couleur de haute qualité représentant divers objets, offrant ainsi un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images issues du jeu de données (crédit) :

Exemples du jeu de données de classification d'images Caltech-256

Les échantillons montrent la diversité et la complexité des objets dans le jeu de données Caltech-256, soulignant l'importance d'un jeu de données varié pour entraîner des modèles de reconnaissance d'objets robustes.

Link to this sectionCitations et remerciements#

Si tu utilises le jeu de données Caltech-256 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Nous tenons à remercier Gregory Griffin, Alex Holub et Pietro Perona pour la création et la maintenance du jeu de données Caltech-256, qui constitue une ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données Caltech-256 et ses créateurs, visite le site web du jeu de données Caltech-256.

Link to this sectionFAQ#

Link to this sectionÀ quoi sert le jeu de données Caltech-256 en apprentissage automatique ?#

Le jeu de données Caltech-256 est largement utilisé pour entraîner et évaluer des modèles de classification d'images et de reconnaissance d'objets. Il contient 30 607 images réparties dans 256 catégories d'objets plus une classe d'arrière-plan, offrant ainsi un benchmark plus vaste et plus difficile que Caltech-101 pour des algorithmes tels que les réseaux de neurones convolutifs (CNNs) et les machines à vecteurs de support (SVMs).

Link to this sectionComment puis-je entraîner un modèle YOLO d'Ultralytics sur le jeu de données Caltech-256 ?#

Pour entraîner un modèle YOLO d'Ultralytics sur Caltech-256, utilise les extraits de code ci-dessous. Le jeu de données se télécharge automatiquement lors de la première utilisation. Pour obtenir une liste complète des arguments, consulte la page Entraînement du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionCombien de classes comporte le jeu de données Caltech-256 ?#

Caltech-256 contient 256 catégories d'objets plus une classe d'arrière-plan 257.clutter, soit 257 dossiers de classes et 30 607 images au total. Lorsque tu entraînes avec Ultralytics, le modèle apprend les 257 classes. Chaque catégorie contient au moins 80 images, mais les tailles des classes sont déséquilibrées, la plus importante en comptant jusqu'à environ 800.

Link to this sectionComment le jeu de données Caltech-256 est-il divisé en ensembles d'entraînement et de validation ?#

Caltech-256 ne possède pas de séparation prédéfinie. Lors de ton premier entraînement, Ultralytics le divise automatiquement en 80 % d'entraînement / 20 % de validation — environ 24 385 images d'entraînement et 6 222 images de validation — tu n'as donc pas besoin de créer des séparations manuellement. Pour contrôler toi-même la séparation, organise les images dans des dossiers train/ et val/ avant l'entraînement.

Link to this sectionPuis-je utiliser Ultralytics Platform pour entraîner des modèles sur le jeu de données Caltech-256 ?#

Oui. Ultralytics Platform te permet de gérer des jeux de données, d'entraîner des modèles de classification d'images et de les déployer sans coder intensivement. C'est un moyen pratique de mener des expériences avec Caltech-256 dans le cloud, et tu peux explorer d'autres options dans notre présentation des jeux de données de classification.

Contributeurs

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Créé 12 nov. 2023Mis à jour hier