Jeu de données Caltech-256
Le jeu de données Caltech-256 est une vaste collection d'images utilisées pour des tâches de classification d'objets. Il contient environ 30 000 images réparties en 257 catégories (256 catégories d'objets et 1 catégorie d'arrière-plan). Les images sont soigneusement sélectionnées et annotées pour fournir un benchmark stimulant et diversifié pour les algorithmes de reconnaissance d'objets.
Le jeu de données Caltech-256, tel qu'il est fourni, ne comporte pas de divisions train/validation prédéfinies. Cependant, lorsque tu utilises les commandes d'entraînement fournies dans les exemples d'utilisation ci-dessous, le framework Ultralytics divisera automatiquement le jeu de données pour toi. La division par défaut utilisée est de 80 % pour le jeu d'entraînement et de 20 % pour le jeu de validation.
Fonctionnalités clés
- Le jeu de données Caltech-256 comprend environ 30 000 images couleur réparties en 257 catégories.
- Chaque catégorie contient un minimum de 80 images.
- Les catégories englobent une grande variété d'objets du monde réel, notamment des animaux, des véhicules, des articles ménagers et des personnes.
- Les images sont de tailles et de résolutions variables.
- Caltech-256 est largement utilisé pour l'entraînement et le test dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.
Structure du jeu de données
Comme Caltech-101, le jeu de données Caltech-256 ne possède pas de séparation formelle entre les jeux d'entraînement et de test. Les utilisateurs créent généralement leurs propres divisions selon leurs besoins spécifiques. Une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement et les images restantes pour le test.
Applications
Le jeu de données Caltech-256 est largement utilisé pour entraîner et évaluer des modèles de deep learning dans des tâches de reconnaissance d'objets, telles que les Convolutional Neural Networks (CNN), les Support Vector Machines (SVM) et divers autres algorithmes d'apprentissage automatique. Son ensemble diversifié de catégories et ses images de haute qualité en font un jeu de données inestimable pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la computer vision.
Utilisation
Pour entraîner un modèle YOLO sur le jeu de données Caltech-256 pendant 100 epochs, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, réfère-toi à la page de Training du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Exemples d'images et d'annotations
Le jeu de données Caltech-256 contient des images couleur de haute qualité de divers objets, fournissant un jeu de données complet pour les tâches de reconnaissance d'objets. Voici quelques exemples d'images du jeu de données (crédit) :

L'exemple met en valeur la diversité et la complexité des objets dans le jeu de données Caltech-256, soulignant l'importance d'un jeu de données varié pour l'entraînement de modèles de reconnaissance d'objets robustes.
Citations et remerciements
Si tu utilises le jeu de données Caltech-256 dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}Nous tenons à remercier Gregory Griffin, Alex Holub et Pietro Perona pour la création et la maintenance du jeu de données Caltech-256 en tant que ressource précieuse pour la communauté de recherche en machine learning et computer vision. Pour plus d'informations sur le jeu de données Caltech-256 et ses créateurs, visite le site web du jeu de données Caltech-256.
FAQ
Qu'est-ce que le jeu de données Caltech-256 et pourquoi est-il important pour l'apprentissage automatique ?
Le jeu de données Caltech-256 est un grand jeu de données d'images utilisé principalement pour des tâches de classification d'objets en apprentissage automatique et en computer vision. Il se compose d'environ 30 000 images couleur réparties en 257 catégories, couvrant une large gamme d'objets du monde réel. La diversité et la qualité élevée des images du jeu de données en font un excellent benchmark pour évaluer les algorithmes de reconnaissance d'objets, ce qui est crucial pour le développement de modèles d'apprentissage automatique robustes.
Comment puis-je entraîner un modèle YOLO sur le jeu de données Caltech-256 en utilisant Python ou l'interface en ligne de commande (CLI) ?
Pour entraîner un modèle YOLO sur le jeu de données Caltech-256 pendant 100 epochs, tu peux utiliser les extraits de code suivants. Réfère-toi à la page de Training du modèle pour des options supplémentaires.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Quels sont les cas d'utilisation les plus courants pour le jeu de données Caltech-256 ?
Le jeu de données Caltech-256 est largement utilisé pour diverses tâches de reconnaissance d'objets telles que :
- L'entraînement de Convolutional Neural Networks (CNN)
- L'évaluation des performances des Support Vector Machines (SVM)
- Le benchmarking de nouveaux algorithmes de deep learning
- Le développement de modèles d'object detection en utilisant des frameworks comme Ultralytics YOLO
Sa diversité et ses annotations complètes le rendent idéal pour la recherche et le développement en apprentissage automatique et en computer vision.
Comment le jeu de données Caltech-256 est-il structuré et divisé pour l'entraînement et le test ?
Le jeu de données Caltech-256 ne vient pas avec une division prédéfinie pour l'entraînement et le test. Les utilisateurs créent généralement leurs propres divisions selon leurs besoins spécifiques. Une approche courante consiste à sélectionner aléatoirement un sous-ensemble d'images pour l'entraînement et à utiliser les images restantes pour le test. Cette flexibilité permet aux utilisateurs d'adapter le jeu de données aux exigences spécifiques de leur projet et à leurs configurations expérimentales.
Pourquoi devrais-je utiliser Ultralytics YOLO pour entraîner des modèles sur le jeu de données Caltech-256 ?
Les modèles Ultralytics YOLO offrent plusieurs avantages pour l'entraînement sur le jeu de données Caltech-256 :
- Haute précision : Les modèles YOLO sont connus pour leurs performances de pointe dans les tâches d'object detection.
- Vitesse : Ils fournissent des capacités d'inférence en temps réel, les rendant adaptés aux applications nécessitant des prédictions rapides.
- Facilité d'utilisation : Avec la Ultralytics Platform, tu peux entraîner, valider et déployer des modèles sans codage extensif.
- Modèles pré-entraînés : Commencer avec des modèles pré-entraînés, comme
yolo26n-cls.pt, peut réduire considérablement le temps d'entraînement et améliorer la accuracy du modèle.
Pour plus de détails, explore notre guide d'entraînement complet et apprends-en plus sur l'image classification avec Ultralytics YOLO.