Skip to main content

Jeu de données ImageNet10

La méthode ImageNet10 le jeu de données est un sous-ensemble à petite échelle de la base de données ImageNet développé par Ultralytics et conçu pour les tests CI, les vérifications de cohérence et les tests rapides de pipelines d'entraînement. Ce jeu de données est composé de la première image du jeu d'entraînement et de la première image du jeu de validation des 10 premières classes d'ImageNet. Bien que nettement plus petit, il conserve la structure et la diversité du jeu de données ImageNet original.

Fonctionnalités clés

  • ImageNet10 est une version compacte d'ImageNet, avec 20 images représentant les 10 premières classes du jeu de données original.
  • Le jeu de données est organisé selon la hiérarchie WordNet, reflétant la structure du jeu de données ImageNet complet.
  • Il est parfaitement adapté aux tests CI, aux vérifications de cohérence et aux tests rapides de pipelines d'entraînement dans computer vision.
  • Bien qu'il ne soit pas conçu pour l'évaluation comparative des modèles, il peut fournir une indication rapide de la fonctionnalité et de la correction de base d'un modèle.

Structure du jeu de données

Le jeu de données ImageNet10, tout comme l'original ImageNet, est organisé en utilisant la hiérarchie WordNet. Chacune des 10 classes dans ImageNet10 est décrite par un synset (une collection de termes synonymes). Les images dans ImageNet10 sont annotées avec un ou plusieurs synsets, offrant une ressource compacte pour tester la capacité des modèles à reconnaître divers objets et leurs relations.

Applications

Le jeu de données ImageNet10 est utile pour tester et déboguer rapidement des modèles de vision par ordinateur et des pipelines. Sa petite taille permet une itération rapide, le rendant idéal pour les tests de intégration continue et les vérifications de cohérence. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests à grande échelle avec le Le jeu de données ImageNet.

Utilisation

complet. Pour tester un modèle d'apprentissage profond sur le jeu de données ImageNet10 avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, réfère-toi au Entraînement.

Exemple de test
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Exemples d'images et d'annotations

Le jeu de données ImageNet10 contient un sous-ensemble d'images provenant du jeu de données ImageNet original. Ces images sont choisies pour représenter les 10 premières classes du jeu de données, offrant un jeu de données diversifié mais compact pour des tests et une évaluation rapides.

Exemple d'images du jeu de données de classification ImageNet-10

L'exemple présente la variété et la complexité des images du jeu de données ImageNet10, soulignant son utilité pour les vérifications de cohérence et les tests rapides de modèles de vision par ordinateur.

Citations et remerciements

Si tu utilises le jeu de données ImageNet10 dans tes travaux de recherche ou de développement, merci de citer l'article original sur ImageNet :

Citation
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance du jeu de données ImageNet. Le jeu de données ImageNet10, bien qu'étant un sous-ensemble compact, est une ressource précieuse pour les tests rapides et le débogage dans le machine learning et la communauté de recherche en vision par ordinateur. Pour plus d'informations sur le jeu de données ImageNet et ses créateurs, visite le site web d'ImageNet.

FAQ

Qu'est-ce que le jeu de données ImageNet10 et en quoi est-il différent du jeu de données ImageNet complet ?

La méthode ImageNet10 le jeu de données est un sous-ensemble compact de la base de données originale ImageNet créé par Ultralytics pour des tests CI rapides, des vérifications de cohérence et des évaluations de pipelines d'entraînement. ImageNet10 comprend seulement 20 images, représentant la première image des jeux d'entraînement et de validation des 10 premières classes d'ImageNet. Malgré sa petite taille, il conserve la structure et la diversité du jeu de données complet, le rendant idéal pour des tests rapides mais pas pour l'évaluation comparative des modèles.

Comment puis-je utiliser le jeu de données ImageNet10 pour tester mon modèle d'apprentissage profond ?

Pour tester ton modèle d'apprentissage profond sur le jeu de données ImageNet10 avec une taille d'image de 224x224, utilise les extraits de code suivants.

Exemple de test
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Réfère-toi au Entraînement page pour une liste complète des arguments disponibles.

Pourquoi devrais-je utiliser le jeu de données ImageNet10 pour les tests CI et les vérifications de cohérence ?

Le jeu de données ImageNet10 est conçu spécifiquement pour les tests CI, les vérifications de cohérence et les évaluations rapides dans deep learning les pipelines. Sa petite taille permet une itération et des tests rapides, le rendant parfait pour les processus d'intégration continue où la vitesse est cruciale. En conservant la complexité structurelle et la diversité du jeu de données ImageNet original, ImageNet10 fournit une indication fiable de la fonctionnalité de base et de la correction d'un modèle sans le surcoût lié au traitement d'un grand jeu de données.

Quelles sont les principales caractéristiques du jeu de données ImageNet10 ?

Le jeu de données ImageNet10 présente plusieurs caractéristiques clés :

  • Taille compacte: Avec seulement 20 images, il permet des tests et un débogage rapides.
  • Organisation structurée: Suit la hiérarchie WordNet, similaire au jeu de données ImageNet complet.
  • CI et vérifications de cohérence: Parfaitement adapté aux tests d'intégration continue et aux vérifications de cohérence.
  • Pas pour l'évaluation comparative: Bien qu'utile pour des évaluations rapides de modèles, il n'est pas conçu pour une évaluation comparative exhaustive.

Comment ImageNet10 se compare-t-il à d'autres petits jeux de données comme ImageNette ?

Bien que les deux ImageNet10 et en ImageNette soient des sous-ensembles d'ImageNet, ils servent des objectifs différents. ImageNet10 contient seulement 20 images (2 par classe) des 10 premières classes d'ImageNet, ce qui le rend extrêmement léger pour les tests CI et les vérifications de cohérence rapides. En revanche, ImageNette contient des milliers d'images réparties sur 10 classes facilement distinguables, ce qui le rend plus adapté à l'entraînement réel de modèles et au développement. ImageNet10 est conçu pour la vérification de la fonctionnalité des pipelines, tandis qu'ImageNette est plus approprié pour des expériences d'entraînement significatives mais plus rapides que celles sur l'ImageNet complet.

Commentaires