Vai al contenuto

Set di dati ImageNet10

Il dataset ImageNet10 è un sottoinsieme in scala ridotta del database ImageNet, sviluppato da Ultralytics e pensato per i test di CI, per i controlli di correttezza e per testare rapidamente le pipeline di formazione. Questo set di dati è composto dalla prima immagine del set di formazione e dalla prima immagine del set di validazione delle prime 10 classi di ImageNet. Sebbene sia significativamente più piccolo, mantiene la struttura e la diversità del dataset ImageNet originale.

Caratteristiche principali

  • ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
  • Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura del dataset completo di ImageNet.
  • È ideale per i test CI, i controlli di correttezza e i test rapidi delle pipeline di formazione nelle attività di computer vision.
  • Sebbene non sia stato progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità e della correttezza di base di un modello.

Struttura del set di dati

Il dataset ImageNet10, come l'ImageNet originale, è organizzato utilizzando la gerarchia WordNet. Ciascuna delle 10 classi di ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini di ImageNet10 sono annotate con uno o più sinonimi, fornendo una risorsa compatta per testare i modelli di riconoscimento di vari oggetti e delle loro relazioni.

Applicazioni

Il dataset ImageNet10 è utile per testare e debuggare rapidamente i modelli e le pipeline di computer vision. Le sue dimensioni ridotte consentono una rapida iterazione, rendendolo ideale per i test di integrazione continua e i controlli di correttezza. Può essere utilizzato anche per testare rapidamente nuovi modelli o modifiche a modelli esistenti prima di passare a test su larga scala con il set di dati ImageNet completo.

Utilizzo

Per testare un modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di formazione del modello.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Immagini di esempio e annotazioni

Il dataset ImageNet10 contiene un sottoinsieme di immagini del dataset ImageNet originale. Queste immagini sono state scelte per rappresentare le prime 10 classi del set di dati, fornendo un set di dati diversificato ma compatto per una rapida verifica e valutazione.

Immagini campione del set di dati L'esempio mostra la varietà e la complessità delle immagini del dataset ImageNet10, evidenziando la sua utilità per i controlli di correttezza e il test rapido dei modelli di computer vision.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il documento originale di ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per la creazione e il mantenimento del dataset ImageNet. Il dataset ImageNet10, pur essendo un sottoinsieme compatto, è una risorsa preziosa per i test e i debug rapidi nella comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset ImageNet e sui suoi creatori, visita il sito web di ImageNet.

DOMANDE FREQUENTI

Che cos'è il dataset ImageNet10 e in che modo è diverso dal dataset ImageNet completo?

Il dataset ImageNet10 è un sottoinsieme compatto del database originale di ImageNet, creato da Ultralytics per effettuare test rapidi di CI, controlli di correttezza e valutazioni della pipeline di formazione. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine degli insiemi di formazione e convalida delle prime 10 classi di ImageNet. Nonostante le sue dimensioni ridotte, mantiene la struttura e la diversità del set di dati completo, rendendolo ideale per i test rapidi ma non per i benchmark dei modelli.

Come posso utilizzare il dataset ImageNet10 per testare il mio modello di deep learning?

Per testare il tuo modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, utilizza i seguenti frammenti di codice.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Per un elenco completo degli argomenti disponibili, consulta la pagina Formazione.

Perché dovrei usare il dataset ImageNet10 per i test CI e i controlli di correttezza?

Il dataset ImageNet10 è stato progettato appositamente per i test di integrazione continua, i controlli di correttezza e le valutazioni rapide nelle pipeline di apprendimento profondo. Le sue dimensioni ridotte consentono un'iterazione e un test rapidi, rendendolo perfetto per i processi di integrazione continua in cui la velocità è fondamentale. Mantenendo la complessità strutturale e la diversità del dataset ImageNet originale, ImageNet10 fornisce un'indicazione affidabile della funzionalità di base e della correttezza di un modello senza l'onere di elaborare un dataset di grandi dimensioni.

Quali sono le caratteristiche principali del dataset ImageNet10?

Il dataset ImageNet10 presenta diverse caratteristiche chiave:

  • Dimensioni compatte: Con sole 20 immagini, consente di eseguire rapidamente test e debug.
  • Organizzazione strutturata: Segue la gerarchia di WordNet, simile a quella del dataset completo di ImageNet.
  • CI e controlli di integrità: È ideale per i test di integrazione continua e per i controlli di integrità.
  • Non per il benchmarking: Sebbene sia utile per una rapida valutazione dei modelli, non è stato progettato per un benchmarking approfondito.

Dove posso scaricare il dataset ImageNet10?

Puoi scaricare il dataset ImageNet10 dalla pagina dei rilasci diUltralytics GitHub. Per informazioni più dettagliate sulla sua struttura e sulle sue applicazioni, consulta la pagina del dataset ImageNet10.



Created 2023-11-12, Updated 2024-07-10
Authors: glenn-jocher (8)

Commenti