Skip to content

Ensemble de données Caltech-256

L'ensemble de données Caltech-256 est une vaste collection d'images utilisées pour des tâches de classification d'objets. Il contient environ 30 000 images réparties en 257 catégories (256 catégories d'objets et 1 catégorie d'arrière-plan). Les images sont soigneusement sélectionnées et annotées afin de fournir une référence difficile et diversifiée pour les algorithmes de reconnaissance d'objets.



Regarde : How to Train Classification des images Model using Caltech-256 Dataset with Ultralytics HUB

Caractéristiques principales

  • L'ensemble de données Caltech-256 comprend environ 30 000 images couleur réparties en 257 catégories.
  • Chaque catégorie contient un minimum de 80 images.
  • Les catégories englobent une grande variété d'objets du monde réel, notamment des animaux, des véhicules, des articles ménagers et des personnes.
  • Les images sont de taille et de résolution variables.
  • Caltech-256 est largement utilisé pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.

Structure de l'ensemble de données

Comme Caltech-101, l'ensemble de données Caltech-256 n'a pas de division formelle entre les ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres séparations en fonction de leurs besoins spécifiques. Une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement et les images restantes pour les tests.

Applications

The Caltech-256 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its diverse set of categories and high-quality images make it an invaluable dataset for research and development in the field of machine learning and computer vision.

Utilisation

Pour entraîner un modèle YOLO sur l'ensemble de données Caltech-256 pendant 100 époques, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Exemples d'images et d'annotations

L'ensemble de données Caltech-256 contient des images couleur de haute qualité de divers objets, ce qui constitue un ensemble de données complet pour les tâches de reconnaissance d'objets. Voici quelques exemples d'images tirées de l'ensemble de données(crédit) :

Image de l'échantillon du jeu de données

L'exemple présente la diversité et la complexité des objets de l'ensemble de données Caltech-256, soulignant l'importance d'un ensemble de données varié pour entraîner des modèles de reconnaissance d'objets robustes.

Citations et remerciements

Si tu utilises le jeu de données Caltech-256 dans tes travaux de recherche ou de développement, cite l'article suivant :

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

We would like to acknowledge Gregory Griffin, Alex Holub, and Pietro Perona for creating and maintaining the Caltech-256 dataset as a valuable resource for the machine learning and computer vision research community. For more information about the

Le jeu de données Caltech-256 et ses créateurs, visite le site web du jeu de données Caltech-256.

FAQ

Qu'est-ce que l'ensemble de données Caltech-256 et pourquoi est-il important pour l'apprentissage automatique ?

L'ensemble de données Caltech-256 est un grand ensemble de données d'images utilisé principalement pour les tâches de classification d'objets dans l'apprentissage automatique et la vision par ordinateur. Il se compose d'environ 30 000 images couleur réparties en 257 catégories, couvrant un large éventail d'objets du monde réel. La diversité et la qualité des images de l'ensemble de données en font une excellente référence pour l'évaluation des algorithmes de reconnaissance d'objets, ce qui est essentiel pour développer des modèles d'apprentissage automatique robustes.

Comment puis-je entraîner un modèle YOLO sur l'ensemble de données Caltech-256 en utilisant Python ou CLI?

To train a YOLO model on the Caltech-256 dataset for 100 epochs, you can use the following code snippets. Refer to the model Training page for additional options.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Quels sont les cas d'utilisation les plus courants de l'ensemble de données Caltech-256 ?

L'ensemble de données Caltech-256 est largement utilisé pour diverses tâches de reconnaissance d'objets, telles que :

Sa diversité et ses annotations complètes en font un outil idéal pour la recherche et le développement dans les domaines de l'apprentissage automatique et de la vision par ordinateur.

Comment l'ensemble de données Caltech-256 est-il structuré et divisé pour la formation et les tests ?

L'ensemble de données Caltech-256 n'est pas accompagné d'une répartition prédéfinie pour l'entraînement et le test. Les utilisateurs créent généralement leur propre répartition en fonction de leurs besoins spécifiques. Une approche courante consiste à sélectionner au hasard un sous-ensemble d'images pour l'entraînement et à utiliser les images restantes pour les tests. Cette flexibilité permet aux utilisateurs d'adapter l'ensemble de données aux exigences spécifiques de leur projet et à leur configuration expérimentale.

Pourquoi devrais-je utiliser Ultralytics YOLO pour former des modèles sur l'ensemble de données Caltech-256 ?

Ultralytics YOLO offrent plusieurs avantages pour la formation sur l'ensemble de données Caltech-256 :

  • Précision élevée: les modèles YOLO sont connus pour leurs performances de pointe dans les tâches de détection d'objets.
  • Rapidité: ils offrent des capacités d'inférence en temps réel, ce qui les rend adaptés aux applications nécessitant des prédictions rapides.
  • Facilité d'utilisation: Avec Ultralytics HUB, les utilisateurs peuvent former, valider et déployer des modèles sans avoir besoin d'un codage approfondi.
  • Modèles pré-entraînés: En partant de modèles pré-entraînés, comme yolo11n-cls.pt, can significantly reduce training time and improve model accuracy.

Pour plus de détails, explore notre guide de formation complet.

📅 Created 11 months ago ✏️ Updated 22 days ago

Commentaires