Skip to content

Ensemble de données ImageNette

L'ensemble de données ImageNette est un sous-ensemble de l'ensemble de données plus vaste Imagenet, mais il ne comprend que 10 classes faciles à distinguer. Il a été créé pour fournir une version plus rapide et plus facile à utiliser d'Imagenet pour le développement de logiciels et l'éducation.

Caractéristiques principales

  • ImageNette contient des images de 10 classes différentes telles que tanche, English springer, lecteur de cassettes, tronçonneuse, église, cor, camion poubelle, pompe à essence, balle de golf, parachute.
  • L'ensemble de données comprend des images colorées de différentes dimensions.
  • ImageNette est largement utilisée pour la formation et les tests dans le domaine de l'apprentissage automatique, notamment pour les tâches de classification d'images.

Structure de l'ensemble de données

L'ensemble de données ImageNette est divisé en deux sous-ensembles :

  1. Ensemble d'entraînement: Ce sous-ensemble contient plusieurs milliers d'images utilisées pour l'entraînement des modèles d'apprentissage automatique. Le nombre exact varie selon les classes.
  2. Ensemble de validation: Ce sous-ensemble se compose de plusieurs centaines d'images utilisées pour valider et comparer les modèles formés. Là encore, le nombre exact varie selon les classes.

Applications

L'ensemble de données ImageNette est largement utilisé pour la formation et l'évaluation des modèles d'apprentissage profond dans les tâches de classification d'images, comme les réseaux neuronaux convolutifs (CNN), et divers autres algorithmes d'apprentissage automatique. Le format simple de l'ensemble de données et les classes bien choisies en font une ressource pratique pour les praticiens débutants et expérimentés dans le domaine de l'apprentissage automatique et de la vision par ordinateur.

Utilisation

Pour entraîner un modèle sur l'ensemble de données ImageNette pendant 100 époques avec une taille d'image standard de 224x224, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenette', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Exemples d'images et d'annotations

L'ensemble de données ImageNette contient des images colorées de divers objets et scènes, ce qui constitue un ensemble de données diversifié pour les tâches de classification d'images. Voici quelques exemples d'images tirées de l'ensemble de données :

Image de l'échantillon du jeu de données

L'exemple présente la variété et la complexité des images de l'ensemble de données ImageNette, soulignant l'importance d'un ensemble de données diversifié pour former des modèles de classification d'images robustes.

ImageNette160 et ImageNette320

Pour un prototypage et une formation plus rapides, l'ensemble de données ImageNette est également disponible en deux tailles réduites : ImageNette160 et ImageNette320. Ces ensembles de données conservent les mêmes classes et la même structure que l'ensemble de données ImageNette complet, mais les images sont redimensionnées à une dimension plus petite. Ces versions de l'ensemble de données sont donc particulièrement utiles pour tester des modèles préliminaires ou lorsque les ressources informatiques sont limitées.

Pour utiliser ces ensembles de données, il suffit de remplacer "imagenette" par "imagenette160" ou "imagenette320" dans la commande d'apprentissage. Les extraits de code suivants illustrent cela :

Exemple de formation avec ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data='imagenette160', epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Exemple de train avec ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data='imagenette320', epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Ces versions plus petites de l'ensemble de données permettent des itérations rapides au cours du processus de développement tout en fournissant des tâches de classification d'images valables et réalistes.

Citations et remerciements

Si tu utilises le jeu de données ImageNette dans tes travaux de recherche ou de développement, merci de le mentionner de manière appropriée. Pour plus d'informations sur le jeu de données ImageNette, visite la page GitHub du jeu de données ImageNette.



Créé le 2023-11-12, Mis à jour le 2024-01-12
Auteurs : glenn-jocher (3)

Commentaires