Jeu de données ImageNet10

Le jeu de données ImageNet10 est un sous-ensemble à petite échelle de la base de données ImageNet, développé par Ultralytics et conçu pour les tests CI, les vérifications de bon sens et les tests rapides de pipelines d'entraînement. Ce jeu de données est composé de la première image de l'ensemble d'entraînement et de la première image de l'ensemble de validation des 10 premières classes d'ImageNet. Bien que nettement plus petit, il conserve la structure et la diversité du jeu de données ImageNet original.

Fonctionnalités clés

  • ImageNet10 est une version compacte d'ImageNet, avec 20 images représentant les 10 premières classes du jeu de données original.
  • Le jeu de données est organisé selon la hiérarchie WordNet, reflétant la structure du jeu de données ImageNet complet.
  • Il est parfaitement adapté aux tests CI, aux vérifications de bon sens et aux tests rapides de pipelines d'entraînement dans les tâches de vision par ordinateur.
  • Bien qu'il ne soit pas conçu pour l'évaluation comparative de modèles, il peut fournir une indication rapide de la fonctionnalité de base et de l'exactitude d'un modèle.

Structure du jeu de données

Le jeu de données ImageNet10, tout comme l'original ImageNet, est organisé en utilisant la hiérarchie WordNet. Chacune des 10 classes dans ImageNet10 est décrite par un synset (une collection de termes synonymes). Les images dans ImageNet10 sont annotées avec un ou plusieurs synsets, offrant une ressource compacte pour tester la capacité des modèles à reconnaître divers objets et leurs relations.

Applications

Le jeu de données ImageNet10 est utile pour tester et déboguer rapidement les modèles et pipelines de vision par ordinateur. Sa petite taille permet une itération rapide, ce qui le rend idéal pour les tests d'intégration continue et les vérifications de bon sens. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests complets avec le jeu de données ImageNet complet.

Utilisation

Pour tester un modèle d'apprentissage profond sur le jeu de données ImageNet10 avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.

Exemple de test
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Exemples d'images et d'annotations

Le jeu de données ImageNet10 contient un sous-ensemble d'images issues du jeu de données ImageNet original. Ces images sont choisies pour représenter les 10 premières classes du jeu de données, offrant un ensemble diversifié mais compact pour des tests et des évaluations rapides.

Exemples d'images du jeu de données de classification ImageNet-10

L'exemple présente la variété et la complexité des images dans le jeu de données ImageNet10, soulignant son utilité pour les vérifications de bon sens et les tests rapides de modèles de vision par ordinateur.

Citations et remerciements

Si tu utilises le jeu de données ImageNet10 dans tes travaux de recherche ou de développement, merci de citer l'article original sur ImageNet :

Citation
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance du jeu de données ImageNet. Le jeu de données ImageNet10, bien qu'étant un sous-ensemble compact, est une ressource précieuse pour tester et déboguer rapidement au sein de la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données ImageNet et ses créateurs, visite le site web d'ImageNet.

FAQ

Qu'est-ce que le jeu de données ImageNet10 et en quoi est-il différent du jeu de données ImageNet complet ?

Le jeu de données ImageNet10 est un sous-ensemble compact de la base de données ImageNet originale, créé par Ultralytics pour des tests CI rapides, des vérifications de bon sens et des évaluations de pipelines d'entraînement. ImageNet10 comprend seulement 20 images, représentant la première image des ensembles d'entraînement et de validation des 10 premières classes d'ImageNet. Malgré sa petite taille, il maintient la structure et la diversité du jeu de données complet, ce qui le rend idéal pour des tests rapides mais pas pour l'évaluation comparative de modèles.

Comment puis-je utiliser le jeu de données ImageNet10 pour tester mon modèle d'apprentissage profond ?

Pour tester ton modèle d'apprentissage profond sur le jeu de données ImageNet10 avec une taille d'image de 224x224, utilise les extraits de code suivants.

Exemple de test
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Consulte la page Entraînement pour obtenir une liste complète des arguments disponibles.

Pourquoi devrais-je utiliser le jeu de données ImageNet10 pour les tests CI et les vérifications de bon sens ?

Le jeu de données ImageNet10 est conçu spécifiquement pour les tests CI, les vérifications de bon sens et les évaluations rapides dans les pipelines d'apprentissage profond. Sa petite taille permet une itération et des tests rapides, ce qui le rend parfait pour les processus d'intégration continue où la vitesse est cruciale. En conservant la complexité structurelle et la diversité du jeu de données ImageNet original, ImageNet10 fournit une indication fiable de la fonctionnalité de base et de l'exactitude d'un modèle sans la surcharge liée au traitement d'un jeu de données volumineux.

Quelles sont les principales caractéristiques du jeu de données ImageNet10 ?

Le jeu de données ImageNet10 possède plusieurs caractéristiques clés :

  • Taille compacte : Avec seulement 20 images, il permet des tests et un débogage rapides.
  • Organisation structurée : Suit la hiérarchie WordNet, similaire au jeu de données ImageNet complet.
  • Tests CI et vérifications de bon sens : Parfaitement adapté aux tests d'intégration continue et aux vérifications de bon sens.
  • Pas pour l'évaluation comparative : Bien qu'utile pour des évaluations rapides de modèles, il n'est pas conçu pour une évaluation comparative approfondie.

Comment ImageNet10 se compare-t-il à d'autres petits jeux de données comme ImageNette ?

Bien que ImageNet10 et ImageNette soient tous deux des sous-ensembles d'ImageNet, ils servent des objectifs différents. ImageNet10 contient seulement 20 images (2 par classe) issues des 10 premières classes d'ImageNet, ce qui le rend extrêmement léger pour les tests CI et les vérifications de bon sens rapides. En revanche, ImageNette contient des milliers d'images réparties sur 10 classes facilement distinguables, ce qui le rend plus adapté à l'entraînement réel et au développement de modèles. ImageNet10 est conçu pour vérifier la fonctionnalité d'un pipeline, tandis qu'ImageNette est plus approprié pour des expériences d'entraînement significatives mais plus rapides que celles réalisées avec l'ImageNet complet.

Commentaires