Dataset ImageNet10
Il dataset ImageNet10 è un sottoinsieme su piccola scala del database ImageNet, sviluppato da Ultralytics e progettato per test CI, controlli di integrità e test rapidi di pipeline di addestramento. Questo dataset è composto dalla prima immagine nel set di addestramento e dalla prima immagine dal set di validazione delle prime 10 classi in ImageNet. Sebbene significativamente più piccolo, mantiene la struttura e la diversità del dataset ImageNet originale.
Caratteristiche principali
- ImageNet10 è una versione compatta di ImageNet, con 20 immagini che rappresentano le prime 10 classi del dataset originale.
- Il dataset è organizzato secondo la gerarchia WordNet, rispecchiando la struttura del dataset ImageNet completo.
- È ideale per test CI, controlli di integrità e test rapidi di pipeline di addestramento in attività di computer vision.
- Sebbene non progettato per il benchmarking dei modelli, può fornire una rapida indicazione della funzionalità di base e della correttezza di un modello.
Struttura del dataset
Il dataset ImageNet10, come l'originale ImageNet, è organizzato utilizzando la gerarchia WordNet. Ognuna delle 10 classi in ImageNet10 è descritta da un synset (una raccolta di termini sinonimi). Le immagini in ImageNet10 sono annotate con uno o più synset, fornendo una risorsa compatta per testare i modelli nel riconoscere vari oggetti e le loro relazioni.
Applicazioni
Il dataset ImageNet10 è utile per testare e sottoporre a debug rapidamente modelli e pipeline di computer vision. Le sue dimensioni ridotte consentono un'iterazione rapida, rendendolo ideale per test di continuous integration e controlli di integrità. Può anche essere utilizzato per test preliminari rapidi di nuovi modelli o modifiche a modelli esistenti prima di passare a test su larga scala con il dataset ImageNet completo.
Utilizzo
Per testare un modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Immagini campione e annotazioni
Il dataset ImageNet10 contiene un sottoinsieme di immagini dal dataset ImageNet originale. Queste immagini sono scelte per rappresentare le prime 10 classi nel dataset, fornendo un dataset diversificato ma compatto per test e valutazioni rapide.

L'esempio mostra la varietà e la complessità delle immagini nel dataset ImageNet10, evidenziandone l'utilità per controlli di integrità e test rapidi di modelli di computer vision.
Citazioni e ringraziamenti
Se utilizzi il dataset ImageNet10 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare l'articolo originale di ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Vorremmo ringraziare il team di ImageNet, guidato da Olga Russakovsky, Jia Deng e Li Fei-Fei, per aver creato e mantenuto il dataset ImageNet. Il dataset ImageNet10, sebbene sia un sottoinsieme compatto, è una risorsa preziosa per test e debug rapidi nella comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset ImageNet e sui suoi creatori, visita il sito web di ImageNet.
FAQ
Cos'è il dataset ImageNet10 e in che modo differisce dal dataset ImageNet completo?
Il dataset ImageNet10 è un sottoinsieme compatto del database originale ImageNet, creato da Ultralytics per test CI rapidi, controlli di integrità e valutazioni di pipeline di addestramento. ImageNet10 comprende solo 20 immagini, che rappresentano la prima immagine nei set di addestramento e validazione delle prime 10 classi in ImageNet. Nonostante le sue dimensioni ridotte, mantiene la struttura e la diversità del dataset completo, rendendolo ideale per test rapidi ma non per il benchmarking dei modelli.
Come posso utilizzare il dataset ImageNet10 per testare il mio modello di deep learning?
Per testare il tuo modello di deep learning sul dataset ImageNet10 con una dimensione dell'immagine di 224x224, utilizza i seguenti frammenti di codice.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Fai riferimento alla pagina Training per un elenco completo degli argomenti disponibili.
Perché dovrei utilizzare il dataset ImageNet10 per test CI e controlli di integrità?
Il dataset ImageNet10 è progettato specificamente per test CI, controlli di integrità e valutazioni rapide in pipeline di deep learning. Le sue dimensioni ridotte consentono un'iterazione e test rapidi, rendendolo perfetto per i processi di continuous integration in cui la velocità è fondamentale. Mantenendo la complessità strutturale e la diversità del dataset ImageNet originale, ImageNet10 fornisce un'indicazione affidabile della funzionalità di base e della correttezza di un modello senza il sovraccarico dell'elaborazione di un dataset di grandi dimensioni.
Quali sono le caratteristiche principali del dataset ImageNet10?
Il dataset ImageNet10 presenta diverse caratteristiche chiave:
- Dimensioni compatte: Con sole 20 immagini, consente test e debug rapidi.
- Organizzazione strutturata: Segue la gerarchia WordNet, simile al dataset ImageNet completo.
- Test CI e controlli di integrità: Ideale per test di continuous integration e controlli di integrità.
- Non per benchmarking: Sebbene utile per valutazioni rapide dei modelli, non è progettato per un benchmarking esteso.
Come si confronta ImageNet10 con altri piccoli dataset come ImageNette?
Sebbene sia ImageNet10 che ImageNette siano sottoinsiemi di ImageNet, servono a scopi diversi. ImageNet10 contiene solo 20 immagini (2 per classe) dalle prime 10 classi di ImageNet, rendendolo estremamente leggero per test CI e controlli di integrità rapidi. Al contrario, ImageNette contiene migliaia di immagini distribuite su 10 classi facilmente distinguibili, rendendolo più adatto all'addestramento e allo sviluppo effettivo dei modelli. ImageNet10 è progettato per la verifica della funzionalità della pipeline, mentre ImageNette è migliore per esperimenti di addestramento significativi ma più veloci rispetto al dataset ImageNet completo.