Dataset ImageNet10
Il dataset ImageNet10 è un sottoinsieme su piccola scala del database ImageNet, sviluppato da Ultralytics e progettato per test CI, controlli di integrità e test rapidi delle pipeline di addestramento. Questo dataset è composto dalla prima immagine nel set di addestramento e dalla prima immagine del set di convalida delle prime 10 classi in ImageNet. Sebbene significativamente più piccolo, conserva la struttura e la diversità del dataset ImageNet originale.
Caratteristiche principali
- ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
- Il dataset è organizzato secondo la gerarchia di WordNet, rispecchiando la struttura dell'intero dataset ImageNet.
- È ideale per test CI, controlli di integrità e test rapidi di pipeline di addestramento in attività di computer vision.
- Sebbene non sia progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità di base e della correttezza di un modello.
Struttura del set di dati
Il dataset ImageNet10, come l'originale ImageNet, è organizzato utilizzando la gerarchia WordNet. Ciascuna delle 10 classi in ImageNet10 è descritta da un synset (una collezione di termini sinonimi). Le immagini in ImageNet10 sono annotate con uno o più synset, fornendo una risorsa compatta per testare modelli per riconoscere vari oggetti e le loro relazioni.
Applicazioni
Il dataset ImageNet10 è utile per testare e debuggare rapidamente modelli e pipeline di computer vision. Le sue dimensioni ridotte consentono un'iterazione rapida, rendendolo ideale per test di integrazione continua e controlli di integrità. Può anche essere utilizzato per test preliminari rapidi di nuovi modelli o modifiche ai modelli esistenti prima di passare a test su vasta scala con il dataset ImageNet completo.
Utilizzo
Per testare un modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.
Esempio di test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Immagini di esempio e annotazioni
Il dataset ImageNet10 contiene un sottoinsieme di immagini del dataset ImageNet originale. Queste immagini sono scelte per rappresentare le prime 10 classi nel dataset, fornendo un dataset diversificato ma compatto per test e valutazioni rapide.

L'esempio mostra la varietà e la complessità delle immagini nel dataset ImageNet10, evidenziandone l'utilità per i controlli di integrità e i test rapidi dei modelli di computer vision.
Citazioni e ringraziamenti
Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, cita l'articolo originale di ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Desideriamo ringraziare il team ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per aver creato e mantenuto il dataset ImageNet. Il dataset ImageNet10, pur essendo un sottoinsieme compatto, è una risorsa preziosa per test rapidi e debug nella community di ricerca sull'apprendimento automatico e sulla computer vision. Per ulteriori informazioni sul dataset ImageNet e sui suoi creatori, visitare il sito web di ImageNet.
FAQ
Cos'è il dataset ImageNet10 e in cosa differisce dal dataset ImageNet completo?
Il dataset ImageNet10 è un sottoinsieme compatto del database ImageNet originale, creato da Ultralytics per test CI rapidi, controlli di integrità e valutazioni della pipeline di addestramento. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine nei set di addestramento e convalida delle prime 10 classi in ImageNet. Nonostante le sue dimensioni ridotte, mantiene la struttura e la diversità dell'intero dataset, rendendolo ideale per test rapidi ma non per il benchmarking dei modelli.
Come posso usare il dataset ImageNet10 per testare il mio modello di deep learning?
Per testare il tuo modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, utilizza i seguenti frammenti di codice.
Esempio di test
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Consulta la pagina di Training per un elenco completo degli argomenti disponibili.
Perché dovrei usare il dataset ImageNet10 per i test CI e i controlli di integrità?
Il dataset ImageNet10 è progettato specificamente per test CI, controlli di integrità e valutazioni rapide nelle pipeline di deep learning. Le sue dimensioni ridotte consentono un'iterazione e un test rapidi, rendendolo perfetto per i processi di integrazione continua in cui la velocità è fondamentale. Mantenendo la complessità strutturale e la diversità del dataset ImageNet originale, ImageNet10 fornisce un'indicazione affidabile della funzionalità di base e della correttezza di un modello senza il sovraccarico di elaborazione di un dataset di grandi dimensioni.
Quali sono le caratteristiche principali del dataset ImageNet10?
Il set di dati ImageNet10 ha diverse caratteristiche chiave:
- Dimensioni compatte: Con sole 20 immagini, consente test e debug rapidi.
- Organizzazione Strutturata: Segue la gerarchia di WordNet, simile al dataset completo ImageNet.
- CI e controlli di integrità: Ideale per test di integrazione continua e controlli di integrità.
- Non per il Benchmarking: Sebbene utile per valutazioni rapide del modello, non è progettato per un benchmarking esteso.
Come si confronta ImageNet10 con altri piccoli set di dati come ImageNette?
Sebbene sia ImageNet10 che ImageNette siano sottoinsiemi di ImageNet, hanno scopi diversi. ImageNet10 contiene solo 20 immagini (2 per classe) dalle prime 10 classi di ImageNet, il che lo rende estremamente leggero per i test CI e rapidi controlli di integrità. Al contrario, ImageNette contiene migliaia di immagini in 10 classi facilmente distinguibili, il che lo rende più adatto per l'effettivo addestramento e sviluppo del modello. ImageNet10 è progettato per la verifica della funzionalità della pipeline, mentre ImageNette è migliore per esperimenti di addestramento significativi ma più veloci rispetto a ImageNet completo.