Vai al contenuto

Dataset ImageWoof

Il dataset ImageWoof è un sottoinsieme di ImageNet composto da 10 classi difficili da classificare, poiché sono tutte razze di cani. È stato creato come un compito più difficile da risolvere per gli algoritmi di classificazione delle immagini, con l'obiettivo di incoraggiare lo sviluppo di modelli più avanzati.

Caratteristiche principali

  • ImageWoof contiene immagini di 10 diverse razze di cani: Australian terrier, Border terrier, Samoiedo, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
  • Il dataset fornisce immagini a varie risoluzioni (dimensione intera, 320px, 160px), adattandosi a diverse capacità computazionali ed esigenze di ricerca.
  • Include anche una versione con etichette rumorose, fornendo uno scenario più realistico in cui le etichette potrebbero non essere sempre affidabili.

Struttura del set di dati

La struttura del dataset ImageWoof si basa sulle classi di razze canine, con ogni razza che ha la propria directory di immagini. Simile ad altri dataset di classificazione, segue un formato di directory suddivisa con cartelle separate per i set di addestramento e validazione.

Applicazioni

Il dataset ImageWoof è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di classificazione delle immagini, specialmente quando si tratta di classi più complesse e simili. La sfida del dataset risiede nelle sottili differenze tra le razze canine, spingendo i limiti delle prestazioni e della generalizzazione del modello. È particolarmente prezioso per:

  • Benchmarking delle prestazioni del modello di classificazione su categorie granulari
  • Verifica della robustezza del modello rispetto a classi dall'aspetto simile
  • Sviluppare algoritmi in grado di distinguere sottili differenze visive
  • Valutazione delle capacità di transfer learning da domini generali a specifici

Utilizzo

Per addestrare un modello CNN sul dataset ImageWoof per 100 epoche con una dimensione dell'immagine di 224x224, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di Training del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Varianti del Dataset

Il dataset ImageWoof è disponibile in tre diverse dimensioni per soddisfare varie esigenze di ricerca e capacità computazionali:

  1. Dimensione intera (imagewoof): Questa è la versione originale del dataset ImageWoof. Contiene immagini a dimensione intera ed è ideale per l'addestramento finale e il benchmarking delle prestazioni.

  2. Dimensione media (imagewoof320): Questa versione contiene immagini ridimensionate per avere una lunghezza massima del bordo di 320 pixel. È adatta per un training più veloce senza sacrificare in modo significativo le prestazioni del modello.

  3. Dimensioni ridotte (imagewoof160): Questa versione contiene immagini ridimensionate per avere una lunghezza massima del bordo di 160 pixel. È progettata per la prototipazione rapida e la sperimentazione in cui la velocità di addestramento è una priorità.

Per utilizzare queste varianti nel tuo training, è sufficiente sostituire 'imagewoof' nell'argomento del dataset con 'imagewoof320' o 'imagewoof160'. Ad esempio:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

È importante notare che l'utilizzo di immagini più piccole probabilmente produrrà prestazioni inferiori in termini di accuratezza della classificazione. Tuttavia, è un ottimo modo per iterare rapidamente nelle prime fasi dello sviluppo e della prototipazione del modello.

Immagini di esempio e annotazioni

Il dataset ImageWoof contiene immagini a colori di varie razze canine, fornendo un dataset stimolante per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini dal dataset:

Immagine di esempio del set di dati

L'esempio mostra le sottili differenze e somiglianze tra le diverse razze canine nel dataset ImageWoof, evidenziando la complessità e la difficoltà del compito di classificazione.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageWoof nel tuo lavoro di ricerca o sviluppo, assicurati di riconoscere i creatori del dataset collegandoti al repository ufficiale del dataset.

Vorremmo ringraziare il team di FastAI per aver creato e mantenuto il dataset ImageWoof come risorsa preziosa per la comunità della ricerca sull'apprendimento automatico e sulla computer vision. Per maggiori informazioni sul dataset ImageWoof, visita il repository del dataset ImageWoof.

FAQ

Cos'è il dataset ImageWoof in Ultralytics?

Il dataset ImageWoof è un sottoinsieme impegnativo di ImageNet incentrato su 10 razze canine specifiche. Creato per spingere i limiti dei modelli di classificazione delle immagini, presenta razze come Beagle, Shih-Tzu e Golden Retriever. Il dataset include immagini a varie risoluzioni (dimensione intera, 320px, 160px) e persino etichette rumorose per scenari di addestramento più realistici. Questa complessità rende ImageWoof ideale per lo sviluppo di modelli di deep learning più avanzati.

Come posso addestrare un modello utilizzando il set di dati ImageWoof con Ultralytics YOLO?

Per addestrare un modello di Rete Neurale Convoluzionale (CNN) sul dataset ImageWoof utilizzando Ultralytics YOLO per 100 epoche con una dimensione dell'immagine di 224x224, puoi utilizzare il seguente codice:

Esempio di addestramento

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Per maggiori dettagli sugli argomenti di addestramento disponibili, consulta la pagina Addestramento.

Quali versioni del dataset ImageWoof sono disponibili?

Il dataset ImageWoof è disponibile in tre dimensioni:

  1. Dimensione intera (imagewoof): Ideale per l'addestramento finale e il benchmarking, contenente immagini a dimensione intera.
  2. Dimensione media (imagewoof320): Immagini ridimensionate con una lunghezza massima del bordo di 320 pixel, adatte per un training più veloce.
  3. Dimensioni ridotte (imagewoof160): Immagini ridimensionate con una lunghezza massima del bordo di 160 pixel, perfette per la prototipazione rapida.

Utilizza queste versioni sostituendo 'imagewoof' nell'argomento del set di dati di conseguenza. Tieni presente, tuttavia, che immagini più piccole possono produrre una precisione di classificazione inferiore, ma possono essere utili per iterazioni più rapide.

In che modo le etichette rumorose nel dataset ImageWoof avvantaggiano l'addestramento?

Le etichette rumorose nel dataset ImageWoof simulano condizioni del mondo reale in cui le etichette potrebbero non essere sempre accurate. L'addestramento di modelli con questi dati aiuta a sviluppare robustezza e generalizzazione nelle attività di classificazione delle immagini. Questo prepara i modelli a gestire efficacemente dati ambigui o con etichette errate, che si incontrano spesso nelle applicazioni pratiche.

Quali sono le principali sfide nell'utilizzo del dataset ImageWoof?

La sfida principale del dataset ImageWoof risiede nelle sottili differenze tra le razze canine che include. Poiché si concentra su 10 razze strettamente correlate, distinguerle richiede modelli di classificazione delle immagini più avanzati e ottimizzati. Questo rende ImageWoof un eccellente benchmark per testare le capacità e i miglioramenti dei modelli di deep learning.



📅 Creato 1 anno fa ✏️ Aggiornato 5 mesi fa

Commenti