Skip to content

Jeu de données Caltech-256

L'ensemble de données Caltech-256 est une vaste collection d'images utilisées pour des tâches de classification d'objets. Il contient environ 30 000 images réparties en 257 catégories (256 catégories d'objets et 1 catégorie d'arrière-plan). Les images sont soigneusement sélectionnées et annotées afin de fournir une référence difficile et diversifiée pour les algorithmes de reconnaissance d'objets.



Regarder : Comment se former Classification des images Modèle utilisant l'ensemble de données Caltech-256 avec Ultralytics HUB

Caractéristiques principales

  • L'ensemble de donnĂ©es Caltech-256 comprend environ 30 000 images couleur rĂ©parties en 257 catĂ©gories.
  • Chaque catĂ©gorie contient un minimum de 80 images.
  • Les catĂ©gories englobent une grande variĂ©tĂ© d'objets du monde rĂ©el, notamment des animaux, des vĂ©hicules, des articles mĂ©nagers et des personnes.
  • Les images sont de taille et de rĂ©solution variables.
  • Caltech-256 est largement utilisĂ© pour la formation et les tests dans le domaine de l'apprentissage automatique, en particulier pour les tâches de reconnaissance d'objets.

Structure de l'ensemble de données

Comme Caltech-101, l'ensemble de données Caltech-256 n'a pas de séparation formelle entre les ensembles d'entraînement et de test. Les utilisateurs créent généralement leurs propres séparations en fonction de leurs besoins spécifiques. Une pratique courante consiste à utiliser un sous-ensemble aléatoire d'images pour l'entraînement et les images restantes pour le test.

Applications

L'ensemble de données Caltech-256 est largement utilisé pour la formation et l'évaluation de modèles d'apprentissage profond dans les tâches de reconnaissance d'objets, tels que les réseaux neuronaux convolutifs (CNN), les machines à vecteurs de support (SVM) et divers autres algorithmes d'apprentissage automatique. La diversité des catégories et la qualité des images en font un ensemble de données inestimable pour la recherche et le développement dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle YOLO sur l'ensemble de données Caltech-256 pendant 100 époques, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page d'entraînement du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Exemples d'images et d'annotations

L'ensemble de données Caltech-256 contient des images couleur de haute qualité de divers objets, fournissant un ensemble de données complet pour les tâches de reconnaissance d'objets. Voici quelques exemples d'images tirées de l'ensemble de données(crédit) :

Image de l'échantillon de l'ensemble de données

L'exemple montre la diversité et la complexité des objets de l'ensemble de données Caltech-256, soulignant l'importance d'un ensemble de données varié pour l'apprentissage de modèles de reconnaissance d'objets robustes.

Citations et remerciements

Si vous utilisez le jeu de données Caltech-256 dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Nous tenons à remercier Gregory Griffin, Alex Holub et Pietro Perona pour la création et la maintenance de l'ensemble de données Caltech-256, qui constitue une ressource précieuse pour la communauté des chercheurs en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur l'ensemble de données Caltech-256

Pour en savoir plus sur le jeu de données Caltech-256 et ses créateurs, visitez le site web du jeu de données Caltech-256.

FAQ

Qu'est-ce que l'ensemble de données Caltech-256 et pourquoi est-il important pour l'apprentissage automatique ?

L'ensemble de données Caltech-256 est un grand ensemble d'images utilisé principalement pour des tâches de classification d'objets dans l'apprentissage automatique et la vision par ordinateur. Il se compose d'environ 30 000 images couleur réparties en 257 catégories, couvrant un large éventail d'objets du monde réel. La diversité et la qualité des images de l'ensemble de données en font une excellente référence pour l'évaluation des algorithmes de reconnaissance d'objets, ce qui est crucial pour le développement de modèles d'apprentissage automatique robustes.

Comment puis-je entraîner un modèle YOLO sur le jeu de données Caltech-256 en utilisant Python ou CLI?

Pour entraîner un modèle YOLO sur l'ensemble de données Caltech-256 pour 100 époques, vous pouvez utiliser les extraits de code suivants. Reportez-vous à la page Entraînement du modèle pour connaître les options supplémentaires.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Quels sont les cas d'utilisation les plus courants du jeu de données Caltech-256 ?

L'ensemble de données Caltech-256 est largement utilisé pour diverses tâches de reconnaissance d'objets, notamment :

Sa diversité et ses annotations complètes en font un outil idéal pour la recherche et le développement dans les domaines de l'apprentissage automatique et de la vision par ordinateur.

Comment l'ensemble de données Caltech-256 est-il structuré et divisé pour la formation et les tests ?

L'ensemble de données Caltech-256 n'est pas accompagné d'une répartition prédéfinie pour l'entraînement et le test. Les utilisateurs créent généralement leur propre répartition en fonction de leurs besoins spécifiques. Une approche courante consiste à sélectionner au hasard un sous-ensemble d'images pour l'entraînement et à utiliser les images restantes pour les tests. Cette flexibilité permet aux utilisateurs d'adapter l'ensemble de données aux exigences spécifiques de leur projet et à leurs configurations expérimentales.

Pourquoi devrais-je utiliser Ultralytics YOLO pour former des modèles sur l'ensemble de données Caltech-256 ?

Ultralytics YOLO offrent plusieurs avantages pour l'entraînement sur l'ensemble de données Caltech-256 :

  • PrĂ©cision Ă©levĂ©e: les modèles YOLO sont connus pour leurs performances de pointe dans les tâches de dĂ©tection d'objets.
  • RapiditĂ©: ils offrent des capacitĂ©s d'infĂ©rence en temps rĂ©el, ce qui les rend adaptĂ©s aux applications nĂ©cessitant des prĂ©dictions rapides.
  • FacilitĂ© d'utilisation: Avec Ultralytics HUB, les utilisateurs peuvent former, valider et dĂ©ployer des modèles sans avoir besoin d'un codage important.
  • Modèles prĂ©-entraĂ®nĂ©s: En partant de modèles prĂ©-entraĂ®nĂ©s, comme yolo11n-cls.ptL'utilisation d'un modèle d'Ă©valuation de la qualitĂ© de l'eau peut rĂ©duire considĂ©rablement le temps de formation et amĂ©liorer la qualitĂ© de l'Ă©valuation du modèle. prĂ©cision.

Pour plus de détails, consultez notre guide de formation complet.

📅C réé il y a 1 an ✏️ Mis à jour il y a 3 mois

Commentaires