Dataset ImageNet10
Il dataset ImageNet10 è un sottoinsieme su piccola scala del database ImageNet, sviluppato da Ultralytics e progettato per test CI, controlli di integrità e test rapidi delle pipeline di addestramento. Questo dataset è composto dalla prima immagine nel set di addestramento e dalla prima immagine del set di convalida delle prime 10 classi in ImageNet. Sebbene significativamente più piccolo, conserva la struttura e la diversità del dataset ImageNet originale.
Caratteristiche principali
- ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
- Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura dell'intero dataset ImageNet.
- È ideale per test CI, controlli di integrità e test rapidi di pipeline di addestramento in attività di computer vision.
- Sebbene non sia progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità di base e della correttezza di un modello.
Struttura del set di dati
Il dataset ImageNet10, come l'originale ImageNet, è organizzato utilizzando la gerarchia WordNet. Ciascuna delle 10 classi in ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini in ImageNet10 sono annotate con uno o più synset, fornendo una risorsa compatta per testare i modelli per riconoscere vari oggetti e le loro relazioni.
Applicazioni
Il dataset ImageNet10 è utile per testare e debuggare rapidamente modelli e pipeline di computer vision. Le sue dimensioni ridotte consentono un'iterazione rapida, rendendolo ideale per i test di integrazione continua e i controlli di integrità. Può anche essere utilizzato per test preliminari rapidi di nuovi modelli o modifiche ai modelli esistenti prima di passare a test su vasta scala con il dataset ImageNet completo.
Utilizzo
Per testare un modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.
Esempio di test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Immagini di esempio e annotazioni
Il set di dati ImageNet10 contiene un sottoinsieme di immagini dal set di dati ImageNet originale. Queste immagini sono scelte per rappresentare le prime 10 classi nel set di dati, fornendo un set di dati diversificato ma compatto per test e valutazioni rapidi.
L'esempio mostra la varietà e la complessità delle immagini nel dataset ImageNet10, evidenziandone l'utilità per i controlli di integrità e i test rapidi dei modelli di computer vision.
Citazioni e ringraziamenti
Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, cita l'articolo originale su ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Desideriamo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per aver creato e mantenuto il dataset ImageNet. Il dataset ImageNet10, pur essendo un sottoinsieme compatto, è una risorsa preziosa per test rapidi e debug nella comunità di ricerca nel campo dell'apprendimento automatico e della computer vision. Per maggiori informazioni sul dataset ImageNet e sui suoi creatori, visitare il sito web di ImageNet.
FAQ
Cos'è il dataset ImageNet10 e in cosa differisce dal dataset ImageNet completo?
Il dataset ImageNet10 è un sottoinsieme compatto del database ImageNet originale, creato da Ultralytics per test CI rapidi, controlli di integrità e valutazioni della pipeline di addestramento. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine nei set di addestramento e convalida delle prime 10 classi in ImageNet. Nonostante le sue piccole dimensioni, mantiene la struttura e la diversità dell'intero dataset, rendendolo ideale per test rapidi ma non per il benchmarking dei modelli.
Come posso usare il dataset ImageNet10 per testare il mio modello di deep learning?
Per testare il tuo modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, utilizza i seguenti frammenti di codice.
Esempio di test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Consulta la pagina di Training per un elenco completo degli argomenti disponibili.
Perché dovrei usare il dataset ImageNet10 per i test CI e i controlli di integrità?
Il set di dati ImageNet10 è progettato specificamente per test CI, controlli di integrità e valutazioni rapide nelle pipeline di deep learning. Le sue dimensioni ridotte consentono un'iterazione e un test rapidi, rendendolo perfetto per i processi di integrazione continua in cui la velocità è fondamentale. Mantenendo la complessità strutturale e la diversità del set di dati ImageNet originale, ImageNet10 fornisce un'indicazione affidabile della funzionalità di base e della correttezza di un modello senza il sovraccarico di elaborazione di un set di dati di grandi dimensioni.
Quali sono le caratteristiche principali del dataset ImageNet10?
Il set di dati ImageNet10 ha diverse caratteristiche chiave:
- Dimensioni compatte: Con sole 20 immagini, consente test e debug rapidi.
- Organizzazione Strutturata: Segue la gerarchia WordNet, simile al dataset ImageNet completo.
- CI e controlli di integrità: Ideale per test di integrazione continua e controlli di integrità.
- Non per il Benchmarking: Sebbene utile per valutazioni rapide del modello, non è progettato per un benchmarking esteso.
Come si confronta ImageNet10 con altri piccoli set di dati come ImageNette?
Sebbene sia ImageNet10 che ImageNette siano sottoinsiemi di ImageNet, servono a scopi diversi. ImageNet10 contiene solo 20 immagini (2 per classe) dalle prime 10 classi di ImageNet, rendendolo estremamente leggero per i test CI e i rapidi controlli di integrità. Al contrario, ImageNette contiene migliaia di immagini in 10 classi facilmente distinguibili, rendendolo più adatto per l'addestramento e lo sviluppo effettivo del modello. ImageNet10 è progettato per la verifica della funzionalità della pipeline, mentre ImageNette è migliore per esperimenti di addestramento significativi ma più veloci rispetto a ImageNet completo.