Skip to content

Jeu de données ImageNet10

L'ensemble de données ImageNet10 est un sous-ensemble à petite échelle de la base de données ImageNet, développé par Ultralytics et conçu pour les tests CI, les vérifications de bon sens et les tests rapides des pipelines de formation. Cet ensemble de données est composé de la première image de l'ensemble d'entraînement et de la première image de l'ensemble de validation des 10 premières classes d'ImageNet. Bien que nettement plus petit, il conserve la structure et la diversité de l'ensemble de données ImageNet original.

Caractéristiques principales

  • ImageNet10 est une version compacte d'ImageNet, avec 20 images reprĂ©sentant les 10 premières classes de l'ensemble de donnĂ©es original.
  • L'ensemble de donnĂ©es est organisĂ© selon la hiĂ©rarchie WordNet, reflĂ©tant la structure de l'ensemble de donnĂ©es ImageNet.
  • Il convient parfaitement aux tests CI, aux vĂ©rifications de bon sens et aux tests rapides des pipelines d'entraĂ®nement dans les tâches de vision par ordinateur.
  • Bien qu'il ne soit pas conçu pour l'Ă©valuation comparative des modèles, il peut fournir une indication rapide de la fonctionnalitĂ© de base et de l'exactitude d'un modèle.

Structure de l'ensemble de données

L'ensemble de données ImageNet10, comme l'original ImageNet, est organisé selon la hiérarchie WordNet. Chacune des 10 classes d'ImageNet10 est décrite par un synset (une collection de termes synonymes). Les images d'ImageNet10 sont annotées avec un ou plusieurs synsets, ce qui constitue une ressource compacte pour tester les modèles de reconnaissance de divers objets et de leurs relations.

Applications

L'ensemble de données ImageNet10 est utile pour tester et déboguer rapidement les modèles et les pipelines de vision par ordinateur. Sa petite taille permet une itération rapide, ce qui le rend idéal pour les tests d'intégration continue et les vérifications de bon sens. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests à grande échelle avec l'ensemble complet de données ImageNet.

Utilisation

Pour tester un modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de test

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet10', epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Exemples d'images et d'annotations

L'ensemble de données ImageNet10 contient un sous-ensemble d'images de l'ensemble de données original ImageNet. Ces images sont choisies pour représenter les 10 premières classes de l'ensemble de données, ce qui permet d'obtenir un ensemble de données diversifié mais compact pour des tests et des évaluations rapides.

Exemple d'images de l'ensemble de données L'exemple présente la variété et la complexité des images de l'ensemble de données ImageNet10, soulignant son utilité pour les vérifications de bon sens et les tests rapides des modèles de vision par ordinateur.

Citations et remerciements

Si tu utilises l'ensemble de données ImageNet10 dans tes travaux de recherche ou de développement, cite l'article original d'ImageNet :

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance de l'ensemble de données ImageNet. L'ensemble de données ImageNet10, bien qu'il s'agisse d'un sous-ensemble compact, est une ressource précieuse pour les tests rapides et le débogage dans la communauté de recherche sur l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations sur l'ensemble de données ImageNet et ses créateurs, visite le site Web d'ImageNet.



Créé le 2023-11-12, Mis à jour le 2024-01-07
Auteurs : glenn-jocher (4)

Commentaires