Vai al contenuto

Set di dati ImageNette

Il set di dati ImageNette è un sottoinsieme del più ampio set di dati Imagenet, ma comprende solo 10 classi facilmente distinguibili. È stato creato per fornire una versione di Imagenet più rapida e facile da usare per lo sviluppo di software e per la didattica.

Caratteristiche principali

  • ImageNette contiene immagini di 10 classi diverse come tinca, English springer, lettore di cassette, motosega, chiesa, corno francese, camion della spazzatura, pompa di benzina, palla da golf, paracadute.
  • Il set di dati comprende immagini colorate di varie dimensioni.
  • ImageNette è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di classificazione delle immagini.

Struttura del set di dati

Il set di dati ImageNette è suddiviso in due sottoinsiemi:

  1. Set di formazione: Questo sottoinsieme contiene diverse migliaia di immagini utilizzate per addestrare i modelli di apprendimento automatico. Il numero esatto varia a seconda della classe.
  2. Set di convalida: Questo sottoinsieme è composto da diverse centinaia di immagini utilizzate per la validazione e il benchmarking dei modelli addestrati. Anche in questo caso, il numero esatto varia a seconda della classe.

Applicazioni

Il dataset ImageNette è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN) e vari altri algoritmi di apprendimento automatico. Il formato semplice del dataset e le classi ben selezionate lo rendono una risorsa utile sia per i principianti che per i professionisti esperti nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello sul dataset ImageNette per 100 epoch con un'immagine di dimensioni standard di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenette', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Immagini di esempio e annotazioni

Il dataset ImageNette contiene immagini colorate di vari oggetti e scene, fornendo un set di dati diversificato per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità delle immagini presenti nel dataset ImageNette, evidenziando l'importanza di un dataset diversificato per l'addestramento di solidi modelli di classificazione delle immagini.

ImageNette160 e ImageNette320

Per velocizzare la prototipazione e la formazione, il dataset ImageNette è disponibile anche in due dimensioni ridotte: ImageNette160 e ImageNette320. Questi dataset mantengono le stesse classi e la stessa struttura del dataset ImageNette completo, ma le immagini sono ridimensionate in una dimensione più piccola. Per questo motivo, queste versioni del dataset sono particolarmente utili per i test preliminari dei modelli o quando le risorse di calcolo sono limitate.

Per utilizzare questi set di dati, basta sostituire "imagenette" con "imagenette160" o "imagenette320" nel comando di formazione. I seguenti frammenti di codice lo illustrano:

Esempio di treno con ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data='imagenette160', epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Esempio di treno con ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data='imagenette320', epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Queste versioni più piccole del set di dati consentono rapide iterazioni durante il processo di sviluppo, fornendo comunque compiti di classificazione delle immagini validi e realistici.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageNette nel tuo lavoro di ricerca o sviluppo, ti preghiamo di riconoscerlo in modo appropriato. Per maggiori informazioni sul dataset ImageNette, visita la pagina GitHub del dataset ImageNette.



Creato 2023-11-12, Aggiornato 2024-01-12
Autori: glenn-jocher (3)

Commenti