Vai al contenuto

Set di dati ImageNet10

Il dataset ImageNet10 è un sottoinsieme in scala ridotta del database ImageNet, sviluppato da Ultralytics e pensato per i test di CI, per i controlli di correttezza e per testare rapidamente le pipeline di formazione. Questo set di dati è composto dalla prima immagine del set di formazione e dalla prima immagine del set di validazione delle prime 10 classi di ImageNet. Sebbene sia significativamente più piccolo, mantiene la struttura e la diversità del dataset ImageNet originale.

Caratteristiche principali

  • ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
  • Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura del dataset completo di ImageNet.
  • È ideale per i test CI, i controlli di correttezza e i test rapidi delle pipeline di formazione nelle attività di computer vision.
  • Sebbene non sia stato progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità e della correttezza di base di un modello.

Struttura del set di dati

Il dataset ImageNet10, come l'ImageNet originale, è organizzato utilizzando la gerarchia WordNet. Ciascuna delle 10 classi di ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini di ImageNet10 sono annotate con uno o più sinonimi, fornendo una risorsa compatta per testare i modelli di riconoscimento di vari oggetti e delle loro relazioni.

Applicazioni

Il dataset ImageNet10 è utile per testare e debuggare rapidamente i modelli e le pipeline di computer vision. Le sue dimensioni ridotte consentono una rapida iterazione, rendendolo ideale per i test di integrazione continua e i controlli di correttezza. Può essere utilizzato anche per testare rapidamente nuovi modelli o modifiche a modelli esistenti prima di passare a test su larga scala con il set di dati ImageNet completo.

Utilizzo

Per testare un modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di formazione del modello.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet10', epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Immagini di esempio e annotazioni

Il dataset ImageNet10 contiene un sottoinsieme di immagini del dataset ImageNet originale. Queste immagini sono state scelte per rappresentare le prime 10 classi del set di dati, fornendo un set di dati diversificato ma compatto per una rapida verifica e valutazione.

Immagini campione del set di dati L'esempio mostra la varietà e la complessità delle immagini del dataset ImageNet10, evidenziando la sua utilità per i controlli di correttezza e il test rapido dei modelli di computer vision.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il documento originale di ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per la creazione e il mantenimento del dataset ImageNet. Il dataset ImageNet10, pur essendo un sottoinsieme compatto, è una risorsa preziosa per i test e i debug rapidi nella comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset ImageNet e sui suoi creatori, visita il sito web di ImageNet.



Creato 2023-11-12, Aggiornato 2024-01-07
Autori: glenn-jocher (4)

Commenti