Skip to content

Jeu de données ImageNet10

Le jeu de données ImageNet10 est un sous-ensemble à petite échelle de la base de données ImageNet, développé par Ultralytics et conçu pour les tests CI, les vérifications de bon sens et les tests rapides des pipelines d'apprentissage. Cet ensemble de données est composé de la première image de l'ensemble d'apprentissage et de la première image de l'ensemble de validation des 10 premières classes d'ImageNet. Bien que nettement plus petit, il conserve la structure et la diversité de l'ensemble de données ImageNet original.

Caractéristiques principales

  • ImageNet10 est une version compacte d'ImageNet, avec 20 images représentant les 10 premières classes de l'ensemble de données original.
  • L'ensemble de données est organisé selon la hiérarchie WordNet, reflétant la structure de l'ensemble de données ImageNet.
  • Il convient parfaitement aux tests CI, aux vérifications d'intégrité et aux tests rapides des pipelines d'apprentissage dans les tâches de vision par ordinateur.
  • Bien qu'il ne soit pas conçu pour l'évaluation comparative des modèles, il peut fournir une indication rapide de la fonctionnalité de base et de l'exactitude d'un modèle.

Structure de l'ensemble de données

L'ensemble de données ImageNet10, comme l'original ImageNet, est organisé selon la hiérarchie WordNet. Chacune des 10 classes d'ImageNet10 est décrite par un synset (une collection de termes synonymes). Les images d'ImageNet10 sont annotées avec un ou plusieurs synsets, ce qui constitue une ressource compacte pour tester les modèles de reconnaissance de divers objets et de leurs relations.

Applications

L'ensemble de données ImageNet10 est utile pour tester et déboguer rapidement les modèles et les pipelines de vision par ordinateur. Sa petite taille permet une itération rapide, ce qui le rend idéal pour les tests d'intégration continue et les contrôles d'intégrité. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests à grande échelle avec l'ensemble des données ImageNet.

Utilisation

Pour tester un modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, vous pouvez utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reportez-vous à la page Formation du modèle.

Exemple de test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Exemples d'images et d'annotations

L'ensemble de données ImageNet10 contient un sous-ensemble d'images de l'ensemble de données original ImageNet. Ces images sont choisies pour représenter les 10 premières classes de l'ensemble de données, ce qui permet de disposer d'un ensemble de données diversifié mais compact pour des tests et des évaluations rapides.

Exemple d'images de l'ensemble de données Cet exemple illustre la variété et la complexité des images de l'ensemble de données ImageNet10, et met en évidence son utilité pour les contrôles d'intégrité et les tests rapides des modèles de vision par ordinateur.

Citations et remerciements

Si vous utilisez l'ensemble de données ImageNet10 dans vos travaux de recherche ou de développement, veuillez citer l'article ImageNet original :

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance de l'ensemble de données ImageNet. L'ensemble de données ImageNet10, bien qu'il s'agisse d'un sous-ensemble compact, constitue une ressource précieuse pour les tests rapides et le débogage dans la communauté de recherche sur l 'apprentissage automatique et la vision par ordinateur. Pour plus d'informations sur l'ensemble de données ImageNet et ses créateurs, visitez le site web ImageNet.

FAQ

Qu'est-ce que l'ensemble de données ImageNet10 et en quoi est-il différent de l'ensemble de données ImageNet complet ?

L'ensemble de données ImageNet10 est un sous-ensemble compact de la base de données ImageNet originale, créé par Ultralytics pour des tests rapides de CI, des vérifications d'intégrité et des évaluations de pipeline de formation. ImageNet10 ne comprend que 20 images, représentant la première image des ensembles de formation et de validation des 10 premières classes d'ImageNet. Malgré sa petite taille, elle conserve la structure et la diversité de l'ensemble de données complet, ce qui la rend idéale pour les tests rapides, mais pas pour l'évaluation comparative des modèles.

Comment puis-je utiliser l'ensemble de données ImageNet10 pour tester mon modèle d'apprentissage profond ?

Pour tester votre modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, utilisez les extraits de code suivants.

Exemple de test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Consultez la page Formation pour obtenir une liste complète des arguments disponibles.

Pourquoi devrais-je utiliser l'ensemble de données ImageNet10 pour les tests CI et les contrôles d'intégrité ?

Le jeu de données ImageNet10 est conçu spécifiquement pour les tests d'intégration continue, les contrôles d'intégrité et les évaluations rapides dans les pipelines d'apprentissage profond. Sa petite taille permet une itération et des tests rapides, ce qui le rend parfait pour les processus d'intégration continue où la vitesse est cruciale. En conservant la complexité structurelle et la diversité de l'ensemble de données ImageNet original, ImageNet10 fournit une indication fiable de la fonctionnalité de base et de l'exactitude d'un modèle sans les frais généraux liés au traitement d'un grand ensemble de données.

Quelles sont les principales caractéristiques de l'ensemble de données ImageNet10 ?

L'ensemble de données ImageNet10 présente plusieurs caractéristiques essentielles :

  • Taille compacte: Avec seulement 20 images, il permet des tests et un débogage rapides.
  • Organisation structurée: Suit la hiérarchie WordNet, similaire à l'ensemble des données ImageNet.
  • Tests d'intégration continue et contrôles d'intégrité: Idéalement conçu pour les tests d'intégration continue et les contrôles d'intégrité.
  • Pas pour l'évaluation comparative: Bien qu'utile pour des évaluations rapides de modèles, il n'est pas conçu pour des analyses comparatives approfondies.

Où puis-je télécharger l'ensemble de données ImageNet10 ?

Vous pouvez télécharger le jeu de données ImageNet10 à partir de la pageUltralytics GitHub releases. Pour des informations plus détaillées sur sa structure et ses applications, consultez la page ImageNet10 Dataset.

📅C réé il y a 1 an ✏️ Mis à jour il y a 3 mois

Commentaires