Skip to content

Jeu de données ImageNet10

L'ensemble de données ImageNet10 est un sous-ensemble à petite échelle de la base de données ImageNet, développé par Ultralytics et conçu pour les tests CI, les vérifications de bon sens et les tests rapides des pipelines de formation. Cet ensemble de données est composé de la première image de l'ensemble d'entraînement et de la première image de l'ensemble de validation des 10 premières classes d'ImageNet. Bien que nettement plus petit, il conserve la structure et la diversité de l'ensemble de données ImageNet original.

Caractéristiques principales

  • ImageNet10 est une version compacte d'ImageNet, avec 20 images représentant les 10 premières classes de l'ensemble de données original.
  • L'ensemble de données est organisé selon la hiérarchie WordNet, reflétant la structure de l'ensemble de données ImageNet.
  • Il convient parfaitement aux tests CI, aux vérifications de bon sens et aux tests rapides des pipelines d'entraînement dans les tâches de vision par ordinateur.
  • Bien qu'il ne soit pas conçu pour l'évaluation comparative des modèles, il peut fournir une indication rapide de la fonctionnalité de base et de l'exactitude d'un modèle.

Structure de l'ensemble de données

L'ensemble de données ImageNet10, comme l'original ImageNet, est organisé selon la hiérarchie WordNet. Chacune des 10 classes d'ImageNet10 est décrite par un synset (une collection de termes synonymes). Les images d'ImageNet10 sont annotées avec un ou plusieurs synsets, ce qui constitue une ressource compacte pour tester les modèles de reconnaissance de divers objets et de leurs relations.

Applications

L'ensemble de données ImageNet10 est utile pour tester et déboguer rapidement les modèles et les pipelines de vision par ordinateur. Sa petite taille permet une itération rapide, ce qui le rend idéal pour les tests d'intégration continue et les vérifications de bon sens. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests à grande échelle avec l'ensemble complet de données ImageNet.

Utilisation

Pour tester un modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de test

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Exemples d'images et d'annotations

L'ensemble de données ImageNet10 contient un sous-ensemble d'images de l'ensemble de données original ImageNet. Ces images sont choisies pour représenter les 10 premières classes de l'ensemble de données, ce qui permet d'obtenir un ensemble de données diversifié mais compact pour des tests et des évaluations rapides.

Exemple d'images de l'ensemble de données L'exemple présente la variété et la complexité des images de l'ensemble de données ImageNet10, en soulignant son utilité pour les contrôles d'intégrité et les tests rapides des modèles de vision par ordinateur.

Citations et remerciements

Si tu utilises l'ensemble de données ImageNet10 dans tes travaux de recherche ou de développement, cite l'article original d'ImageNet :

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance de l'ensemble de données ImageNet. L'ensemble de données ImageNet10, bien qu'il s'agisse d'un sous-ensemble compact, est une ressource précieuse pour les tests rapides et le débogage dans la communauté de recherche sur l'apprentissage automatique et la vision par ordinateur. Pour plus d'informations sur l'ensemble de données ImageNet et ses créateurs, visite le site Web d'ImageNet.

FAQ

Qu'est-ce que l'ensemble de données ImageNet10 et en quoi est-il différent de l'ensemble de données ImageNet complet ?

L'ensemble de données ImageNet10 est un sous-ensemble compact de la base de données ImageNet originale, créé par Ultralytics pour des tests rapides de CI, des vérifications d'intégrité et des évaluations de pipeline de formation. ImageNet10 ne comprend que 20 images, représentant la première image des ensembles de formation et de validation des 10 premières classes d'ImageNet. Malgré sa petite taille, il conserve la structure et la diversité de l'ensemble de données complet, ce qui le rend idéal pour les tests rapides, mais pas pour l'évaluation comparative des modèles.

Comment puis-je utiliser l'ensemble de données ImageNet10 pour tester mon modèle d'apprentissage profond ?

Pour tester ton modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, utilise les extraits de code suivants.

Exemple de test

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Reporte-toi à la page Formation pour obtenir une liste complète des arguments disponibles.

Pourquoi devrais-je utiliser l'ensemble de données ImageNet10 pour les tests CI et les contrôles d'intégrité ?

L'ensemble de données ImageNet10 est conçu spécifiquement pour les tests CI, les contrôles de régularité et les évaluations rapides dans les pipelines d'apprentissage profond. Sa petite taille permet une itération et des tests rapides, ce qui le rend parfait pour les processus d'intégration continue où la vitesse est cruciale. En conservant la complexité structurelle et la diversité de l'ensemble de données ImageNet original, ImageNet10 fournit une indication fiable de la fonctionnalité de base et de l'exactitude d'un modèle sans les frais généraux liés au traitement d'un grand ensemble de données.

Quelles sont les principales caractéristiques de l'ensemble de données ImageNet10 ?

L'ensemble de données ImageNet10 présente plusieurs caractéristiques essentielles :

  • Taille compacte: Avec seulement 20 images, il permet des tests et des débogages rapides.
  • Organisation structurée: Suit la hiérarchie WordNet, similaire à l'ensemble des données ImageNet.
  • Tests d'intégration continue et contrôles d'intégrité: Convient idéalement pour les tests d'intégration continue et les contrôles d'hygiène.
  • Pas pour l'analyse comparative: Bien qu'il soit utile pour évaluer rapidement les modèles, il n'est pas conçu pour une analyse comparative approfondie.

Où puis-je télécharger l'ensemble de données ImageNet10 ?

Tu peux télécharger le jeu de données ImageNet10 à partir de la pageUltralytics GitHub releases. Pour des informations plus détaillées sur sa structure et ses applications, reporte-toi à la page du jeu de données ImageNet10.



Créé le 2023-11-12, Mis à jour le 2024-07-10
Auteurs : glenn-jocher (8)

Commentaires