Link to this sectionJeu de données Caltech-101#
Le jeu de données Caltech-101 est un jeu de données largement utilisé pour les tâches de reconnaissance d'objets, contenant environ 9 000 images réparties en 101 catégories d'objets. Les catégories ont été choisies pour refléter une variété d'objets du monde réel, et les images elles-mêmes ont été soigneusement sélectionnées et annotées pour fournir une référence exigeante pour les algorithmes de reconnaissance d'objets.
Le jeu de données Caltech-101, tel qu'il est fourni, ne contient pas de divisions prédéfinies pour l'entraînement et la validation. Cependant, lorsque tu utilises les commandes d'entraînement fournies dans les exemples d'utilisation ci-dessous, le framework Ultralytics fractionnera automatiquement le jeu de données pour toi. Le fractionnement par défaut utilisé est de 80 % pour l'ensemble d'entraînement et de 20 % pour l'ensemble de validation.
Link to this sectionFonctionnalités clés#
- Le jeu de données Caltech-101 comprend environ 9 000 images couleur divisées en 101 catégories.
- Les catégories couvrent une grande variété d'objets, notamment des animaux, des véhicules, des articles ménagers et des personnes.
- Le nombre d'images par catégorie varie, avec environ 40 à 800 images dans chaque catégorie.
- Les images sont de tailles variables, la plupart étant en résolution moyenne.
- Caltech-101 est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.
Link to this sectionStructure du jeu de données#
Contrairement à beaucoup d'autres jeux de données, le jeu de données Caltech-101 n'est pas formellement divisé en ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres divisions en fonction de leurs besoins spécifiques. Cependant, une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement (par exemple, 30 images par catégorie) et les images restantes pour les tests.
Link to this sectionApplications#
Le jeu de données Caltech-101 est largement utilisé pour entraîner et évaluer des modèles d'apprentissage profond dans des tâches de reconnaissance d'objets, telles que les réseaux de neurones convolutifs (CNNs), les machines à vecteurs de support (SVMs) et divers autres algorithmes d'apprentissage automatique. Sa grande variété de catégories et ses images de haute qualité en font un excellent jeu de données pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Link to this sectionUtilisation#
Pour entraîner un modèle YOLO sur le jeu de données Caltech-101 pendant 100 époques, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionExemples d'images et annotations#
Le jeu de données Caltech-101 contient des images couleur de haute qualité d'objets variés, fournissant un jeu de données bien structuré pour les tâches de classification d'images. Voici quelques exemples d'images provenant du jeu de données :

L'exemple présente la variété et la complexité des objets dans le jeu de données Caltech-101, soulignant l'importance d'un jeu de données diversifié pour entraîner des modèles de reconnaissance d'objets robustes.
Link to this sectionCitations et remerciements#
Si tu utilises le jeu de données Caltech-101 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Nous tenons à remercier Li Fei-Fei, Rob Fergus et Pietro Perona pour avoir créé et maintenu le jeu de données Caltech-101 en tant que ressource précieuse pour la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données Caltech-101 et ses créateurs, visite le site web du jeu de données Caltech-101.
Link to this sectionFAQ#
Link to this sectionÀ quoi sert le jeu de données Caltech-101 dans l'apprentissage automatique ?#
Le jeu de données Caltech-101 est largement utilisé en apprentissage automatique pour les tâches de reconnaissance d'objets. Il contient environ 9 000 images réparties en 101 catégories, offrant une référence exigeante pour évaluer les algorithmes de reconnaissance d'objets. Les chercheurs l'utilisent pour entraîner et tester des modèles, notamment les réseaux de neurones convolutifs (CNNs) et les machines à vecteurs de support (SVMs), en vision par ordinateur.
Link to this sectionComment puis-je entraîner un modèle YOLO d'Ultralytics sur le jeu de données Caltech-101 ?#
Pour entraîner un modèle YOLO d'Ultralytics sur le jeu de données Caltech-101, tu peux utiliser les extraits de code fournis. Par exemple, pour entraîner pendant 100 époques :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Pour des arguments et des options plus détaillés, consulte la page Entraînement du modèle.
Link to this sectionQuelles sont les principales caractéristiques du jeu de données Caltech-101 ?#
Le jeu de données Caltech-101 comprend :
- Environ 9 000 images couleur réparties en 101 catégories.
- Des catégories couvrant une gamme diversifiée d'objets, notamment des animaux, des véhicules et des articles ménagers.
- Un nombre variable d'images par catégorie, généralement compris entre 40 et 800.
- Des tailles d'images variables, la plupart étant en résolution moyenne.
Ces caractéristiques en font un excellent choix pour entraîner et évaluer des modèles de reconnaissance d'objets en apprentissage automatique et en vision par ordinateur.
Link to this sectionPourquoi devrais-je citer le jeu de données Caltech-101 dans mes recherches ?#
Citer le jeu de données Caltech-101 dans tes recherches reconnaît les contributions des créateurs et fournit une référence pour les autres personnes susceptibles d'utiliser le jeu de données. La citation recommandée est :
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}La citation aide à maintenir l'intégrité des travaux académiques et aide tes pairs à localiser la ressource originale.
Link to this sectionPuis-je utiliser la plateforme Ultralytics pour entraîner des modèles sur le jeu de données Caltech-101 ?#
Oui, tu peux utiliser la plateforme Ultralytics pour entraîner des modèles sur le jeu de données Caltech-101. La plateforme Ultralytics offre un environnement intuitif pour gérer les jeux de données, entraîner des modèles et les déployer sans codage intensif. Pour un guide détaillé, consulte l'article de blog comment entraîner tes propres modèles avec la plateforme Ultralytics.