Ensemble de données Caltech-256
L'ensemble de données Caltech-256 est une vaste collection d'images utilisées pour les tâches de classification d'objets. Il contient environ 30 000 images réparties en 257 catégories (256 catégories d'objets et 1 catégorie d'arrière-plan). Les images sont soigneusement sélectionnées et annotées afin de fournir un banc d'essai stimulant et diversifié pour les algorithmes de reconnaissance d'objets.
Regarder : Comment entraîner Classification d'images Modèle utilisant l'ensemble de données Caltech-256 avec Ultralytics HUB
Division automatique des données
L'ensemble de données Caltech-256, tel que fourni, n'est pas livré avec des divisions train/validation prédéfinies. Cependant, lorsque vous utilisez les commandes d'entraînement fournies dans les exemples d'utilisation ci-dessous, le framework Ultralytics divisera automatiquement l'ensemble de données pour vous. La division par défaut utilisée est de 80 % pour l'ensemble d'entraînement et de 20 % pour l'ensemble de validation.
Principales caractéristiques
- L'ensemble de données Caltech-256 comprend environ 30 000 images couleur réparties en 257 catégories.
- Chaque catégorie contient un minimum de 80 images.
- Les catégories englobent une grande variété d'objets du monde réel, y compris des animaux, des véhicules, des articles ménagers et des personnes.
- Les images sont de tailles et de résolutions variables.
- Caltech-256 est largement utilisé pour l'entraînement et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.
Structure du jeu de données
Comme Caltech-101, l'ensemble de données Caltech-256 n'a pas de séparation formelle entre les ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres divisions en fonction de leurs besoins spécifiques. Une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement et les images restantes pour les tests.
Applications
L'ensemble de données Caltech-256 est largement utilisé pour l'entraînement et l'évaluation de modèles de deep learning dans les tâches de reconnaissance d'objets, tels que les Convolutional Neural Networks (CNN), les Support Vector Machines (SVM) et divers autres algorithmes d'apprentissage automatique. Son ensemble diversifié de catégories et ses images de haute qualité en font un ensemble de données inestimable pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.
Utilisation
Pour entraîner un modèle YOLO sur le jeu de données Caltech-256 pendant 100 epochs, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Training du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Images et annotations d'exemple
Le jeu de données Caltech-256 contient des images couleur de haute qualité de divers objets, fournissant un ensemble de données complet pour les tâches de reconnaissance d'objets. Voici quelques exemples d'images du jeu de données (crédit) :
L'exemple illustre la diversité et la complexité des objets dans le jeu de données Caltech-256, soulignant l'importance d'un ensemble de données varié pour l'entraînement de modèles robustes de reconnaissance d'objets.
Citations et remerciements
Si vous utilisez le jeu de données Caltech-256 dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}
Nous tenons à remercier Gregory Griffin, Alex Holub et Pietro Perona pour la création et la maintenance de l'ensemble de données Caltech-256, une ressource précieuse pour la communauté de la recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données Caltech-256 et ses créateurs, consultez le site web de l'ensemble de données Caltech-256.
FAQ
Qu'est-ce que le jeu de données Caltech-256 et pourquoi est-il important pour l'apprentissage automatique ?
Le jeu de données Caltech-256 est un grand ensemble de données d'images utilisé principalement pour les tâches de classification d'objets en apprentissage automatique et en vision par ordinateur. Il se compose d'environ 30 000 images couleur divisées en 257 catégories, couvrant un large éventail d'objets du monde réel. Les images diverses et de haute qualité de l'ensemble de données en font un excellent banc d'essai pour l'évaluation des algorithmes de reconnaissance d'objets, ce qui est essentiel pour le développement de modèles d'apprentissage automatique robustes.
Comment puis-je entraîner un modèle YOLO sur le jeu de données Caltech-256 en utilisant Python ou la CLI ?
Pour entraîner un modèle YOLO sur l'ensemble de données Caltech-256 pendant 100 epochs, vous pouvez utiliser les extraits de code suivants. Consultez la page Formation du modèle pour connaître les options supplémentaires.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Quels sont les cas d'utilisation les plus courants pour le jeu de données Caltech-256 ?
L'ensemble de données Caltech-256 est largement utilisé pour diverses tâches de reconnaissance d'objets telles que :
- Formation de réseaux neuronaux convolutionnels (CNN)
- Évaluation des performances des machines à vecteurs de support (SVM)
- Évaluation comparative de nouveaux algorithmes d'apprentissage profond
- Développement de modèles de détection d'objets à l'aide de frameworks tels que Ultralytics YOLO
Sa diversité et ses annotations complètes le rendent idéal pour la recherche et le développement dans l'apprentissage automatique et la vision par ordinateur.
Comment le jeu de données Caltech-256 est-il structuré et divisé pour l'entraînement et les tests ?
Le jeu de données Caltech-256 n'est pas fourni avec une division prédéfinie pour l'entraînement et les tests. Les utilisateurs créent généralement leurs propres divisions en fonction de leurs besoins spécifiques. Une approche courante consiste à sélectionner aléatoirement un sous-ensemble d'images pour l'entraînement et à utiliser les images restantes pour les tests. Cette flexibilité permet aux utilisateurs d'adapter le jeu de données aux exigences spécifiques de leur projet et à leurs configurations expérimentales.
Pourquoi devrais-je utiliser Ultralytics YOLO pour entraîner des modèles sur le jeu de données Caltech-256 ?
Les modèles Ultralytics YOLO offrent plusieurs avantages pour l'entraînement sur l'ensemble de données Caltech-256 :
- Haute précision : Les modèles YOLO sont connus pour leurs performances de pointe dans les tâches de détection d'objets.
- Vitesse : Ils offrent des capacités d'inférence en temps réel, ce qui les rend adaptés aux applications nécessitant des prédictions rapides.
- Facilité d'utilisation : Avec Ultralytics HUB, les utilisateurs peuvent former, valider et déployer des modèles sans codage intensif.
- Modèles pré-entraînés: En commençant par des modèles pré-entraînés, comme
yolo11n-cls.pt
, peut réduire considérablement le temps d'entraînement et améliorer le modèle précision.
Pour plus de détails, explorez notre guide d'entraînement complet et découvrez la classification d'images avec Ultralytics YOLO.