Link to this sectionJeu de données Caltech-101#

Le dataset Caltech-101 est une référence classique en classification d'images composée de 9 144 images réparties en 101 catégories d'objets et une classe d'arrière-plan. Chaque catégorie contient environ 40 à 800 images d'objets du monde réel — animaux, véhicules, articles ménagers et personnes — ce qui en fait une référence compacte mais stimulante pour les modèles de reconnaissance d'objets.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

Fractionnement automatique des données

Caltech-101 est fourni sans répartition prédéfinie entre entraînement et validation. Les commandes d'entraînement ci-dessous le divisent automatiquement en 80 % pour l'entraînement et 20 % pour la validation, aucune préparation manuelle n'est donc nécessaire.

Link to this sectionFonctionnalités clés#

Caltech-101 contient 9 144 images en couleur réparties sur 101 catégories d'objets plus une classe BACKGROUND_Google (soit 102 dossiers de classes au total).
Les catégories couvrent une grande variété d'objets du monde réel, notamment des animaux, des véhicules, des articles ménagers et des personnes.
Chaque catégorie contient environ 40 à 800 images, les tailles des classes sont donc déséquilibrées.
Les images ont des tailles variables, la plupart faisant environ 300x200 pixels (résolution moyenne).
Caltech-101 est largement utilisé pour évaluer les algorithmes de classification d'images et de reconnaissance d'objets.

Link to this sectionStructure du jeu de données#

Caltech-101 est distribué sous forme de 102 dossiers — un par classe, couvrant 101 catégories d'objets plus une classe BACKGROUND_Google — sans répartition prédéfinie entre entraînement et validation. Lorsque tu lances l'entraînement, Ultralytics partitionne automatiquement les images afin que les modèles s'entraînent sur l'ensemble des 102 classes sans aucune configuration manuelle :

Classes : 102 (101 catégories d'objets + 1 arrière-plan)
Nombre total d'images : 9 144
Répartition entraînement/validation : automatique 80 % / 20 % (≈ 7 280 pour l'entraînement, ≈ 1 864 pour la validation)
Images par classe : environ 40 à 800 (déséquilibré)

Link to this sectionApplications#

Caltech-101 est largement utilisé pour entraîner et évaluer des modèles de classification d'images et de reconnaissance d'objets, y compris les réseaux de neurones convolutifs (CNN) et les machines à vecteurs de support (SVM). Sa large couverture de catégories et ses images propres et étiquetées en font une référence populaire pour la recherche et le prototypage en apprentissage automatique et en vision par ordinateur.

Link to this sectionUtilisation#

Entraîne un modèle YOLO sur Caltech-101 pendant 100 époques avec une taille d'image de 416. Pour obtenir la liste complète des arguments disponibles, consulte la page Entraînement et le guide de tâche classification d'images.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionExemples d'images et annotations#

Le jeu de données Caltech-101 contient des images couleur de haute qualité d'objets variés, fournissant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images provenant du jeu de données :

Exemples du jeu de données de classification d'images Caltech-101

Les échantillons montrent la variété des catégories et le cadrage naturel et centré typique de Caltech-101, ce qui en fait un point de départ propre pour entraîner des modèles robustes de reconnaissance d'objets.

Link to this sectionCitations et remerciements#

Si tu utilises le jeu de données Caltech-101 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Nous tenons à remercier Li Fei-Fei, Rob Fergus et Pietro Perona pour avoir créé et maintenu le jeu de données Caltech-101 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données Caltech-101 et ses créateurs, visite le site web du jeu de données Caltech-101.

Link to this sectionFAQ#

Link to this sectionÀ quoi sert le jeu de données Caltech-101 dans l'apprentissage automatique ?#

Le dataset Caltech-101 est largement utilisé pour entraîner et évaluer des modèles de classification d'images et de reconnaissance d'objets. Il contient 9 144 images réparties sur 101 catégories d'objets plus une classe d'arrière-plan, offrant une référence stimulante pour évaluer des algorithmes tels que les réseaux de neurones convolutifs (CNN) et les machines à vecteurs de support (SVM).

Link to this sectionComment puis-je entraîner un modèle YOLO d'Ultralytics sur le jeu de données Caltech-101 ?#

Pour entraîner un modèle Ultralytics YOLO sur Caltech-101, utilise les extraits de code ci-dessous. Le dataset se télécharge automatiquement lors de la première utilisation. Pour une liste complète des arguments, consulte la page Entraînement du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionCombien de classes le dataset Caltech-101 comporte-t-il ?#

Caltech-101 contient 101 catégories d'objets plus une classe BACKGROUND_Google, soit 102 dossiers de classes et 9 144 images au total. Lorsque tu lances un entraînement avec Ultralytics, le modèle apprend l'ensemble des 102 classes. La taille des catégories est déséquilibrée, allant d'environ 40 à 800 images chacune.

Link to this sectionComment le dataset Caltech-101 est-il divisé en ensembles d'entraînement et de validation ?#

Caltech-101 n'a pas de répartition prédéfinie. Lors de ton premier entraînement, Ultralytics le divise automatiquement à 80 % pour l'entraînement et 20 % pour la validation — soit environ 7 280 images d'entraînement et 1 864 images de validation — tu n'as donc pas besoin de créer manuellement les ensembles. Si tu souhaites contrôler la répartition toi-même, organise les images dans des dossiers train/ et val/ avant l'entraînement.

Link to this sectionPuis-je utiliser la plateforme Ultralytics pour entraîner des modèles sur le jeu de données Caltech-101 ?#

Oui. La plateforme Ultralytics te permet de gérer tes datasets, d'entraîner des modèles de classification d'images et de les déployer sans avoir à coder intensément. C'est un moyen pratique d'exécuter des expériences avec Caltech-101 dans le cloud, et tu peux explorer d'autres options dans notre aperçu des datasets de classification.

Contributeurs

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Créé 12 nov. 2023Mis à jour il y a 3 jours