Vai al contenuto

Set di dati ImageNet10

Il dataset ImageNet10 è un sottoinsieme in scala ridotta del database ImageNet, sviluppato da Ultralytics e pensato per i test di CI, per i controlli di correttezza e per testare rapidamente le pipeline di formazione. Questo set di dati è composto dalla prima immagine del set di formazione e dalla prima immagine del set di validazione delle prime 10 classi di ImageNet. Sebbene sia significativamente più piccolo, mantiene la struttura e la diversità del dataset ImageNet originale.

Caratteristiche principali

  • ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
  • Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura del dataset completo di ImageNet.
  • It is ideally suited for CI tests, sanity checks, and rapid testing of training pipelines in computer vision tasks.
  • Sebbene non sia stato progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità e della correttezza di base di un modello.

Struttura del set di dati

Il dataset ImageNet10, come l'ImageNet originale, è organizzato utilizzando la gerarchia WordNet. Ciascuna delle 10 classi di ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini di ImageNet10 sono annotate con uno o più sinonimi, fornendo una risorsa compatta per testare i modelli di riconoscimento di vari oggetti e delle loro relazioni.

Applicazioni

Il dataset ImageNet10 è utile per testare e debuggare rapidamente i modelli e le pipeline di computer vision. Le sue dimensioni ridotte consentono una rapida iterazione, rendendolo ideale per i test di integrazione continua e i controlli di correttezza. Può essere utilizzato anche per testare rapidamente nuovi modelli o modifiche a modelli esistenti prima di passare a test su larga scala con il set di dati ImageNet completo.

Utilizzo

Per testare un modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di formazione del modello.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Immagini di esempio e annotazioni

Il dataset ImageNet10 contiene un sottoinsieme di immagini del dataset ImageNet originale. Queste immagini sono state scelte per rappresentare le prime 10 classi del set di dati, fornendo un set di dati diversificato ma compatto per una rapida verifica e valutazione.

Immagini campione del set di dati L'esempio mostra la varietà e la complessità delle immagini del dataset ImageNet10, evidenziando la sua utilità per i controlli di correttezza e il test rapido dei modelli di computer vision.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il documento originale di ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

We would like to acknowledge the ImageNet team, led by Olga Russakovsky, Jia Deng, and Li Fei-Fei, for creating and maintaining the ImageNet dataset. The ImageNet10 dataset, while a compact subset, is a valuable resource for quick testing and debugging in the machine learning and computer vision research community. For more information about the ImageNet dataset and its creators, visit the ImageNet website.

DOMANDE FREQUENTI

Che cos'è il dataset ImageNet10 e in che modo è diverso dal dataset ImageNet completo?

Il dataset ImageNet10 è un sottoinsieme compatto del database originale di ImageNet, creato da Ultralytics per effettuare test rapidi di CI, controlli di correttezza e valutazioni della pipeline di formazione. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine degli insiemi di formazione e convalida delle prime 10 classi di ImageNet. Nonostante le sue dimensioni ridotte, mantiene la struttura e la diversità del set di dati completo, rendendolo ideale per i test rapidi ma non per i benchmark dei modelli.

Come posso utilizzare il dataset ImageNet10 per testare il mio modello di deep learning?

Per testare il tuo modello di deep learning sul dataset ImageNet10 con un'immagine di dimensioni 224x224, utilizza i seguenti frammenti di codice.

Esempio di test

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Per un elenco completo degli argomenti disponibili, consulta la pagina Formazione.

Perché dovrei usare il dataset ImageNet10 per i test CI e i controlli di correttezza?

The ImageNet10 dataset is designed specifically for CI tests, sanity checks, and quick evaluations in deep learning pipelines. Its small size allows for rapid iteration and testing, making it perfect for continuous integration processes where speed is crucial. By maintaining the structural complexity and diversity of the original ImageNet dataset, ImageNet10 provides a reliable indication of a model's basic functionality and correctness without the overhead of processing a large dataset.

Quali sono le caratteristiche principali del dataset ImageNet10?

Il dataset ImageNet10 presenta diverse caratteristiche chiave:

  • Dimensioni compatte: Con sole 20 immagini, consente di eseguire rapidamente test e debug.
  • Organizzazione strutturata: Segue la gerarchia di WordNet, simile a quella del dataset completo di ImageNet.
  • CI e controlli di integrità: È ideale per i test di integrazione continua e per i controlli di integrità.
  • Non per il benchmarking: Sebbene sia utile per una rapida valutazione dei modelli, non è stato progettato per un benchmarking approfondito.

Dove posso scaricare il dataset ImageNet10?

Puoi scaricare il dataset ImageNet10 dalla pagina dei rilasci diUltralytics GitHub. Per informazioni più dettagliate sulla sua struttura e sulle sue applicazioni, consulta la pagina del dataset ImageNet10.

📅 Created 11 months ago ✏️ Updated 22 days ago

Commenti