Set di dati ImageWoof
Il dataset ImageWoof è un sottoinsieme di ImageNet composto da 10 classi difficili da classificare, in quanto sono tutte razze di cani. È stato creato come compito più difficile da risolvere per gli algoritmi di classificazione delle immagini, con l'obiettivo di incoraggiare lo sviluppo di modelli più avanzati.
Caratteristiche principali
- ImageWoof contiene immagini di 10 razze canine diverse: Australian terrier, Border terrier, Samoiedo, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
- Il set di dati fornisce immagini a varie risoluzioni (dimensioni reali, 320px, 160px), in modo da soddisfare le diverse capacità di calcolo e le esigenze di ricerca.
- Include anche una versione con etichette rumorose, che offre uno scenario più realistico in cui le etichette potrebbero non essere sempre affidabili.
Struttura del set di dati
La struttura del dataset di ImageWoof si basa sulle classi di razze canine, con ogni razza che ha una propria directory di immagini.
Applicazioni
Il dataset ImageWoof è ampiamente utilizzato per l'addestramento e la valutazione dei modelli di deep learning nelle attività di classificazione delle immagini, soprattutto quando si tratta di classi più complesse e simili. La sfida del dataset risiede nelle sottili differenze tra le razze canine, che spingono i limiti delle prestazioni e della generalizzazione del modello.
Utilizzo
Per addestrare un modello CNN sul dataset ImageWoof per 100 epoch con un'immagine di dimensioni 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.
Esempio di treno
Varianti del set di dati
Il set di dati ImageWoof è disponibile in tre diverse dimensioni per soddisfare le varie esigenze di ricerca e le capacità di calcolo:
-
Dimensione completa (imagewoof): Questa è la versione originale del dataset ImageWoof. Contiene immagini a grandezza naturale ed è ideale per l'addestramento finale e il benchmarking delle prestazioni.
-
Dimensione media (imagewoof320): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 320 pixel. È adatta per un addestramento più rapido senza sacrificare in modo significativo le prestazioni del modello.
-
Dimensioni ridotte (imagewoof160): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 160 pixel. È pensata per la prototipazione rapida e la sperimentazione in cui la velocità di formazione è una priorità .
Per utilizzare queste varianti nell'addestramento, è sufficiente sostituire "imagewoof" nell'argomento del dataset con "imagewoof320" o "imagewoof160". Ad esempio:
from ultralytics import YOLO
# Load a model
model = YOLO('yolov8n-cls.pt') # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)
# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)
È importante notare che l'utilizzo di immagini più piccole probabilmente produrrà prestazioni inferiori in termini di accuratezza della classificazione. Tuttavia, è un modo eccellente per iterare rapidamente nelle prime fasi di sviluppo del modello e di prototipazione.
Immagini di esempio e annotazioni
Il dataset ImageWoof contiene immagini colorate di varie razze di cani, fornendo un dataset impegnativo per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:
L'esempio mostra le sottili differenze e somiglianze tra le diverse razze di cani nel dataset ImageWoof, evidenziando la complessità e la difficoltà del compito di classificazione.
Citazioni e ringraziamenti
Se utilizzi il dataset ImageWoof nel tuo lavoro di ricerca o sviluppo, assicurati di riconoscere i creatori del dataset collegandoti al repository ufficiale del dataset.
Desideriamo ringraziare il team di FastAI per aver creato e mantenuto il dataset ImageWoof come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per maggiori informazioni sul dataset ImageWoof, visita il repository del dataset ImageWoof.