Vai al contenuto

Set di dati ImageNet10

Il dataset ImageNet10 è un sottoinsieme su scala ridotta del database ImageNet, sviluppato da Ultralytics e progettato per i test di CI, i controlli di correttezza e il test rapido delle pipeline di addestramento. Questo set di dati è composto dalla prima immagine del set di addestramento e dalla prima immagine del set di validazione delle prime 10 classi di ImageNet. Sebbene sia significativamente più piccolo, mantiene la struttura e la diversità del dataset ImageNet originale.

Caratteristiche principali

  • ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
  • Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura del dataset completo di ImageNet.
  • È ideale per i test CI, i controlli di correttezza e la verifica rapida delle pipeline di addestramento nelle attività di computer vision.
  • Sebbene non sia stato progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità e della correttezza di base di un modello.

Struttura del set di dati

Il dataset ImageNet10, come l'ImageNet originale, è organizzato utilizzando la gerarchia di WordNet. Ciascuna delle 10 classi di ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini di ImageNet10 sono annotate con uno o più synset, fornendo una risorsa compatta per testare i modelli di riconoscimento di vari oggetti e delle loro relazioni.

Applicazioni

Il dataset ImageNet10 è utile per testare e debuggare rapidamente i modelli e le pipeline di computer vision. Le sue dimensioni ridotte consentono una rapida iterazione, rendendolo ideale per i test di integrazione continua e i controlli di correttezza. Può anche essere utilizzato per un rapido test preliminare di nuovi modelli o di modifiche a modelli esistenti prima di passare a un test su larga scala con il set di dati ImageNet completo.

Utilizzo

Per testare un modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, si possono usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Immagini di esempio e annotazioni

Il dataset ImageNet10 contiene un sottoinsieme di immagini del dataset ImageNet originale. Queste immagini sono state scelte per rappresentare le prime 10 classi del set di dati, fornendo un set di dati diversificato ma compatto per una rapida verifica e valutazione.

Immagini campione del set di dati L'esempio mostra la varietà e la complessità delle immagini del dataset ImageNet10, evidenziandone l'utilità per i controlli di correttezza e per il test rapido dei modelli di computer vision.

Citazioni e ringraziamenti

Se si utilizza il dataset ImageNet10 nel proprio lavoro di ricerca o sviluppo, si prega di citare il documento originale di ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per la creazione e il mantenimento del dataset ImageNet. Il dataset ImageNet10, pur essendo un sottoinsieme compatto, è una risorsa preziosa per i test e il debugging rapidi nella comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul dataset ImageNet e sui suoi creatori, visitare il sito web di ImageNet.

FAQ

Che cos'è il dataset ImageNet10 e come si differenzia dal dataset ImageNet completo?

Il dataset ImageNet10 è un sottoinsieme compatto del database originale di ImageNet, creato da Ultralytics per test rapidi di CI, controlli di correttezza e valutazioni della pipeline di addestramento. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine nei set di addestramento e di validazione delle prime 10 classi di ImageNet. Nonostante le dimensioni ridotte, mantiene la struttura e la diversità del set di dati completo, rendendolo ideale per i test rapidi ma non per i benchmark dei modelli.

Come posso utilizzare il dataset ImageNet10 per testare il mio modello di deep learning?

Per testare il modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, utilizzare i seguenti frammenti di codice.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Per un elenco completo degli argomenti disponibili, consultare la pagina Formazione.

Perché utilizzare il dataset ImageNet10 per i test CI e i controlli di correttezza?

Il dataset ImageNet10 è stato progettato specificamente per i test di integrazione continua, i controlli di correttezza e le valutazioni rapide nelle pipeline di apprendimento profondo. Le sue dimensioni ridotte consentono un'iterazione e un test rapidi, rendendolo perfetto per i processi di integrazione continua in cui la velocità è fondamentale. Mantenendo la complessità strutturale e la diversità del dataset ImageNet originale, ImageNet10 fornisce un'indicazione affidabile della funzionalità di base e della correttezza di un modello senza l'onere di elaborare un dataset di grandi dimensioni.

Quali sono le caratteristiche principali del dataset ImageNet10?

Il dataset ImageNet10 presenta diverse caratteristiche chiave:

  • Dimensioni compatte: Con sole 20 immagini, consente di eseguire rapidamente test e debug.
  • Organizzazione strutturata: Segue la gerarchia di WordNet, simile al dataset completo di ImageNet.
  • CI e controlli di integrità: Ideale per i test di integrazione continua e per i controlli di integrità.
  • Non per il benchmarking: Pur essendo utile per una rapida valutazione dei modelli, non è stato progettato per un benchmarking approfondito.

Dove posso scaricare il dataset ImageNet10?

È possibile scaricare il dataset ImageNet10 dalla pagina dei rilasci diUltralytics GitHub. Per informazioni più dettagliate sulla sua struttura e sulle sue applicazioni, consultare la pagina del dataset ImageNet10.

📅C reato 1 anno fa ✏️ Aggiornato 2 mesi fa

Commenti