Dataset ImageWoof
Il dataset ImageWoof è un sottoinsieme di ImageNet costituito da 10 classi difficili da classificare, poiché si tratta tutte di razze canine. È stato creato come compito più complesso per gli algoritmi di classificazione delle immagini, con l'obiettivo di incoraggiare lo sviluppo di modelli più avanzati.
Caratteristiche principali
- ImageWoof contiene immagini di 10 diverse razze canine: Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
- Il dataset fornisce immagini a varie risoluzioni (dimensione intera, 320px, 160px), adattandosi a diverse capacità computazionali e esigenze di ricerca.
- Include anche una versione con etichette rumorose, offrendo uno scenario più realistico in cui le etichette potrebbero non essere sempre affidabili.
Struttura del dataset
La struttura del dataset ImageWoof si basa sulle classi di razze canine, con ogni razza che ha la propria directory di immagini. Similmente ad altri dataset di classificazione, segue un formato a directory suddivise con cartelle separate per i set di addestramento e di validazione.
Applicazioni
Il dataset ImageWoof è ampiamente utilizzato per addestrare e valutare modelli di deep learning in attività di classificazione delle immagini, specialmente quando si tratta di classi più complesse e simili. La sfida del dataset risiede nelle sottili differenze tra le razze canine, spingendo al limite le prestazioni e la generalizzazione del modello. È particolarmente utile per:
- Effettuare il benchmarking delle prestazioni dei modelli di classificazione su categorie a grana fine
- Testare la robustezza del modello contro classi dall'aspetto simile
- Sviluppare algoritmi in grado di distinguere sottili differenze visive
- Valutare le capacità di transfer learning da domini generali a specifici
Utilizzo
Per addestrare un modello CNN sul dataset ImageWoof per 100 epoche con una dimensione dell'immagine di 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Addestramento del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)Varianti del Dataset
Il dataset ImageWoof è disponibile in tre diverse dimensioni per soddisfare varie esigenze di ricerca e capacità computazionali:
-
Dimensione intera (imagewoof): Questa è la versione originale del dataset ImageWoof. Contiene immagini a dimensione intera ed è ideale per l'addestramento finale e il benchmarking delle prestazioni.
-
Dimensione media (imagewoof320): Questa versione contiene immagini ridimensionate per avere una lunghezza massima del bordo di 320 pixel. È adatta per un addestramento più rapido senza sacrificare significativamente le prestazioni del modello.
-
Dimensione ridotta (imagewoof160): Questa versione contiene immagini ridimensionate per avere una lunghezza massima del bordo di 160 pixel. È progettata per una prototipazione rapida e per esperimenti in cui la velocità di addestramento è una priorità.
Per utilizzare queste varianti nel tuo addestramento, sostituisci semplicemente 'imagewoof' nell'argomento del dataset con 'imagewoof320' o 'imagewoof160'. Per esempio:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)È importante notare che l'utilizzo di immagini più piccole probabilmente produrrà prestazioni inferiori in termini di accuratezza della classificazione. Tuttavia, è un modo eccellente per iterare rapidamente nelle prime fasi dello sviluppo del modello e della prototipazione.
Immagini campione e annotazioni
Il dataset ImageWoof contiene immagini colorate di varie razze canine, fornendo un dataset impegnativo per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini dal dataset:

L'esempio mostra le sottili differenze e somiglianze tra le diverse razze canine nel dataset ImageWoof, evidenziando la complessità e la difficoltà dell'attività di classificazione.
Citazioni e ringraziamenti
Se utilizzi il dataset ImageWoof nel tuo lavoro di ricerca o sviluppo, assicurati di riconoscere i creatori del dataset inserendo un link al repository ufficiale del dataset.
Vorremmo ringraziare il team di FastAI per aver creato e mantenuto il dataset ImageWoof come una risorsa preziosa per la comunità di ricerca sul machine learning e sulla computer vision. Per maggiori informazioni sul dataset ImageWoof, visita il repository del dataset ImageWoof.
FAQ
Cos'è il dataset ImageWoof in Ultralytics?
Il dataset ImageWoof è un impegnativo sottoinsieme di ImageNet che si concentra su 10 razze canine specifiche. Creato per spingere i limiti dei modelli di classificazione delle immagini, presenta razze come Beagle, Shih-Tzu e Golden Retriever. Il dataset include immagini a varie risoluzioni (dimensione intera, 320px, 160px) e persino etichette rumorose per scenari di addestramento più realistici. Questa complessità rende ImageWoof ideale per lo sviluppo di modelli di deep learning più avanzati.
Come posso addestrare un modello utilizzando il dataset ImageWoof con Ultralytics YOLO?
Per addestrare un modello di Convolutional Neural Network (CNN) sul dataset ImageWoof utilizzando Ultralytics YOLO per 100 epoche con una dimensione dell'immagine di 224x224, puoi utilizzare il seguente codice:
from ultralytics import YOLO
model = YOLO("yolo26n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)Per ulteriori dettagli sugli argomenti di addestramento disponibili, fai riferimento alla pagina di Addestramento.
Quali versioni del dataset ImageWoof sono disponibili?
Il dataset ImageWoof è disponibile in tre dimensioni:
- Dimensione intera (imagewoof): Ideale per l'addestramento finale e il benchmarking, contiene immagini a dimensione intera.
- Dimensione media (imagewoof320): Immagini ridimensionate con una lunghezza massima del bordo di 320 pixel, adatte per un addestramento più rapido.
- Dimensione ridotta (imagewoof160): Immagini ridimensionate con una lunghezza massima del bordo di 160 pixel, perfette per la prototipazione rapida.
Utilizza queste versioni sostituendo 'imagewoof' nell'argomento del dataset di conseguenza. Nota, tuttavia, che immagini più piccole possono produrre un'accuratezza di classificazione inferiore, ma possono essere utili per iterazioni più rapide.
In che modo le etichette rumorose nel dataset ImageWoof favoriscono l'addestramento?
Le etichette rumorose nel dataset ImageWoof simulano condizioni reali in cui le etichette potrebbero non essere sempre accurate. Addestrare modelli con questi dati aiuta a sviluppare robustezza e generalizzazione nelle attività di classificazione delle immagini. Questo prepara i modelli a gestire efficacemente dati ambigui o etichettati erroneamente, il che viene spesso riscontrato nelle applicazioni pratiche.
Quali sono le sfide principali nell'utilizzo del dataset ImageWoof?
La sfida principale del dataset ImageWoof risiede nelle sottili differenze tra le razze canine che include. Poiché si concentra su 10 razze strettamente correlate, distinguerle richiede modelli di classificazione delle immagini più avanzati e perfezionati. Questo rende ImageWoof un eccellente benchmark per testare le capacità e i miglioramenti dei modelli di deep learning.