Ensemble de données ImageNet10
L'ensemble de données ImageNet10 est un sous-ensemble à petite échelle de la base de données ImageNet, développé par Ultralytics et conçu pour les tests CI, les contrôles de cohérence et les tests rapides des pipelines d'entraînement. Cet ensemble de données est composé de la première image de l'ensemble d'entraînement et de la première image de l'ensemble de validation des 10 premières classes d'ImageNet. Bien que significativement plus petit, il conserve la structure et la diversité de l'ensemble de données ImageNet original.
Principales caractéristiques
- ImageNet10 est une version compacte d'ImageNet, avec 20 images représentant les 10 premières classes de l'ensemble de données original.
- L'ensemble de données est organisé selon la hiérarchie WordNet, reflétant la structure de l'ensemble de données ImageNet complet.
- Il est idéalement adapté aux tests d'intégration continue, aux contrôles de cohérence et aux tests rapides des pipelines d'entraînement dans les tâches de vision par ordinateur.
- Bien qu'il ne soit pas conçu pour l'évaluation comparative des modèles, il peut donner une indication rapide des fonctionnalités de base et de l'exactitude d'un modèle.
Structure du jeu de données
Le dataset ImageNet10, comme l'ImageNet original, est organisé selon la hiérarchie WordNet. Chacune des 10 classes d'ImageNet10 est décrite par un synset (un ensemble de termes synonymes). Les images d'ImageNet10 sont annotées avec un ou plusieurs synsets, fournissant une ressource compacte pour tester les modèles afin de reconnaître divers objets et leurs relations.
Applications
Le dataset ImageNet10 est utile pour tester et déboguer rapidement les modèles et les pipelines de vision par ordinateur. Sa petite taille permet une itération rapide, ce qui le rend idéal pour les tests d'intégration continue et les contrôles de cohérence. Il peut également être utilisé pour des tests préliminaires rapides de nouveaux modèles ou de modifications apportées à des modèles existants avant de passer à des tests à grande échelle avec l'ensemble du dataset ImageNet.
Utilisation
Pour tester un modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.
Exemple de test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Images et annotations d'exemple
L'ensemble de données ImageNet10 contient un sous-ensemble d'images de l'ensemble de données ImageNet original. Ces images sont choisies pour représenter les 10 premières classes de l'ensemble de données, fournissant un ensemble de données diversifié mais compact pour des tests et une évaluation rapides.
Cet exemple illustre la variété et la complexité des images dans l'ensemble de données ImageNet10, soulignant son utilité pour les contrôles de cohérence et les tests rapides des modèles de vision par ordinateur.
Citations et remerciements
Si vous utilisez l'ensemble de données ImageNet10 dans vos travaux de recherche ou de développement, veuillez citer l'article original d'ImageNet :
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Nous tenons à remercier l'équipe ImageNet, dirigée par Olga Russakovsky, Jia Deng et Li Fei-Fei, pour la création et la maintenance du jeu de données ImageNet. Le jeu de données ImageNet10, bien qu'étant un sous-ensemble compact, est une ressource précieuse pour les tests rapides et le débogage dans la communauté de recherche en apprentissage automatique et en vision par ordinateur. Pour plus d'informations sur le jeu de données ImageNet et ses créateurs, consultez le site web d'ImageNet.
FAQ
Qu'est-ce que le jeu de données ImageNet10 et en quoi diffère-t-il du jeu de données ImageNet complet ?
L'ensemble de données ImageNet10 est un sous-ensemble compact de la base de données ImageNet originale, créé par Ultralytics pour des tests CI rapides, des contrôles de cohérence et des évaluations de pipelines d'entraînement. ImageNet10 ne comprend que 20 images, représentant la première image des ensembles d'entraînement et de validation des 10 premières classes d'ImageNet. Malgré sa petite taille, il maintient la structure et la diversité de l'ensemble de données complet, ce qui le rend idéal pour des tests rapides, mais pas pour l'évaluation comparative des modèles.
Comment puis-je utiliser l’ensemble de données ImageNet10 pour tester mon modèle d’apprentissage profond ?
Pour tester votre modèle d'apprentissage profond sur l'ensemble de données ImageNet10 avec une taille d'image de 224x224, utilisez les extraits de code suivants.
Exemple de test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Consultez la page Formation pour obtenir une liste complète des arguments disponibles.
Pourquoi devrais-je utiliser l'ensemble de données ImageNet10 pour les tests CI et les contrôles de cohérence ?
L'ensemble de données ImageNet10 est spécialement conçu pour les tests CI, les contrôles de cohérence et les évaluations rapides dans les pipelines d'apprentissage profond. Sa petite taille permet une itération et des tests rapides, ce qui le rend parfait pour les processus d'intégration continue où la vitesse est cruciale. En conservant la complexité structurelle et la diversité de l'ensemble de données ImageNet original, ImageNet10 fournit une indication fiable de la fonctionnalité de base et de l'exactitude d'un modèle sans la surcharge du traitement d'un grand ensemble de données.
Quelles sont les principales caractéristiques du jeu de données ImageNet10 ?
L'ensemble de données ImageNet10 possède plusieurs caractéristiques clés :
- Taille compacte : Avec seulement 20 images, il permet des tests et un débogage rapides.
- Organisation structurée : Suit la hiérarchie WordNet, similaire à l'ensemble de données ImageNet complet.
- CI et contrôles de cohérence: Idéal pour les tests d'intégration continue et les contrôles de cohérence.
- Ne convient pas pour le benchmarking : Bien qu’utile pour les évaluations rapides de modèles, il n’est pas conçu pour un benchmarking approfondi.
Comment ImageNet10 se compare-t-il à d'autres petits ensembles de données comme ImageNette ?
Bien que ImageNet10 et ImageNette soient tous deux des sous-ensembles d'ImageNet, ils servent des objectifs différents. ImageNet10 ne contient que 20 images (2 par classe) des 10 premières classes d'ImageNet, ce qui le rend extrêmement léger pour les tests d'intégration continue et les vérifications rapides. En revanche, ImageNette contient des milliers d'images réparties dans 10 classes facilement distinguables, ce qui le rend plus adapté à l'entraînement et au développement de modèles réels. ImageNet10 est conçu pour la vérification de la fonctionnalité du pipeline, tandis qu'ImageNette est préférable pour des expériences d'entraînement significatives mais plus rapides que l'ensemble d'ImageNet.