Jeu de données Caltech-101

Le jeu de données Caltech-101 est largement utilisé pour les tâches de reconnaissance d'objets. Il contient environ 9 000 images réparties en 101 catégories d'objets. Les catégories ont été choisies pour refléter une grande variété d'objets du monde réel, et les images elles-mêmes ont été sélectionnées et annotées avec soin pour offrir un benchmark stimulant pour les algorithmes de reconnaissance d'objets.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics Platform
Division automatique des données

Le jeu de données Caltech-101, tel qu'il est fourni, ne contient pas de divisions prédéfinies entre entraînement et validation. Cependant, lorsque tu utilises les commandes d'entraînement fournies dans les exemples d'utilisation ci-dessous, le framework Ultralytics divisera automatiquement le jeu de données pour toi. La division par défaut est de 80 % pour l'ensemble d'entraînement et de 20 % pour l'ensemble de validation.

Fonctionnalités clés

  • Le jeu de données Caltech-101 comprend environ 9 000 images en couleur divisées en 101 catégories.
  • Les catégories englobent une grande variété d'objets, notamment des animaux, des véhicules, des objets domestiques et des personnes.
  • Le nombre d'images par catégorie varie, avec environ 40 à 800 images dans chaque catégorie.
  • Les images sont de tailles variables, la plupart ayant une résolution moyenne.
  • Caltech-101 est largement utilisé pour l'entraînement et le test dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.

Structure du jeu de données

Contrairement à beaucoup d'autres jeux de données, le jeu de données Caltech-101 n'est pas officiellement divisé en ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres divisions selon leurs besoins spécifiques. Une pratique courante consiste toutefois à utiliser un sous-ensemble aléatoire d'images pour l'entraînement (par exemple, 30 images par catégorie) et les images restantes pour le test.

Applications

Le jeu de données Caltech-101 est largement utilisé pour entraîner et évaluer des modèles de deep learning dans des tâches de reconnaissance d'objets, tels que les Convolutional Neural Networks (CNNs), les Support Vector Machines (SVMs) et divers autres algorithmes d'apprentissage automatique. Sa grande variété de catégories et ses images de haute qualité en font un excellent jeu de données pour la recherche et le développement dans le domaine de l'machine learning et de la computer vision.

Utilisation

Pour entraîner un modèle YOLO sur le jeu de données Caltech-101 pendant 100 epochs, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Training du modèle.

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Exemples d'images et d'annotations

Le jeu de données Caltech-101 contient des images couleur de haute qualité de divers objets, offrant un jeu de données bien structuré pour les tâches d'image classification. Voici quelques exemples d'images provenant du jeu de données :

Exemples du jeu de données de classification d'images Caltech-101

Cet exemple illustre la variété et la complexité des objets dans le jeu de données Caltech-101, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de reconnaissance d'objets robustes.

Citations et remerciements

Si tu utilises le jeu de données Caltech-101 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Nous tenons à remercier Li Fei-Fei, Rob Fergus et Pietro Perona pour avoir créé et maintenu le jeu de données Caltech-101 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en computer vision. Pour plus d'informations sur le jeu de données Caltech-101 et ses créateurs, visite le site web du jeu de données Caltech-101.

FAQ

À quoi sert le jeu de données Caltech-101 en apprentissage automatique ?

Le jeu de données Caltech-101 est largement utilisé en apprentissage automatique pour des tâches de reconnaissance d'objets. Il contient environ 9 000 images réparties sur 101 catégories, offrant un benchmark exigeant pour évaluer les algorithmes de reconnaissance d'objets. Les chercheurs l'utilisent pour entraîner et tester des modèles, notamment des Convolutional Neural Networks (CNNs) et des Support Vector Machines (SVMs), en computer vision.

Comment puis-je entraîner un modèle Ultralytics YOLO sur le jeu de données Caltech-101 ?

Pour entraîner un modèle Ultralytics YOLO sur le jeu de données Caltech-101, tu peux utiliser les extraits de code fournis. Par exemple, pour un entraînement sur 100 epochs :

Exemple d'entraînement
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Pour des arguments et options plus détaillés, réfère-toi à la page Training du modèle.

Quelles sont les caractéristiques clés du jeu de données Caltech-101 ?

Le jeu de données Caltech-101 inclut :

  • Environ 9 000 images couleur réparties sur 101 catégories.
  • Des catégories couvrant une gamme diversifiée d'objets, incluant des animaux, des véhicules et des objets domestiques.
  • Un nombre variable d'images par catégorie, généralement entre 40 et 800.
  • Des tailles d'images variables, la plupart étant de résolution moyenne.

Ces caractéristiques en font un excellent choix pour l'entraînement et l'évaluation de modèles de reconnaissance d'objets en apprentissage automatique et en computer vision.

Pourquoi devrais-je citer le jeu de données Caltech-101 dans mes recherches ?

Citer le jeu de données Caltech-101 dans tes recherches permet de reconnaître les contributions des créateurs et fournit une référence pour les autres personnes susceptibles d'utiliser ce jeu de données. La citation recommandée est :

Citation
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citer contribue à maintenir l'intégrité du travail académique et aide tes pairs à localiser la ressource originale.

Puis-je utiliser Ultralytics Platform pour entraîner des modèles sur le jeu de données Caltech-101 ?

Oui, tu peux utiliser Ultralytics Platform pour entraîner des modèles sur le jeu de données Caltech-101. Ultralytics Platform offre une plateforme intuitive pour gérer les jeux de données, entraîner des modèles et les déployer sans codage approfondi. Pour un guide détaillé, consulte l'article de blog how to train your custom models with Ultralytics Platform.

Commentaires