Vai al contenuto

Set di dati ImageWoof

Il dataset ImageWoof è un sottoinsieme di ImageNet composto da 10 classi difficili da classificare, in quanto sono tutte razze di cani. È stato creato come compito più difficile da risolvere per gli algoritmi di classificazione delle immagini, con l'obiettivo di incoraggiare lo sviluppo di modelli più avanzati.

Caratteristiche principali

  • ImageWoof contiene immagini di 10 razze canine diverse: Australian terrier, Border terrier, Samoiedo, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
  • Il set di dati fornisce immagini a varie risoluzioni (dimensioni reali, 320px, 160px), in modo da soddisfare le diverse capacità di calcolo e le esigenze di ricerca.
  • Include anche una versione con etichette rumorose, che offre uno scenario più realistico in cui le etichette potrebbero non essere sempre affidabili.

Struttura del set di dati

La struttura del dataset di ImageWoof si basa sulle classi di razze canine, con ogni razza che ha una propria directory di immagini.

Applicazioni

Il dataset ImageWoof è ampiamente utilizzato per l'addestramento e la valutazione dei modelli di deep learning nelle attività di classificazione delle immagini, soprattutto quando si tratta di classi più complesse e simili. La sfida del dataset risiede nelle sottili differenze tra le razze canine, che spingono i limiti delle prestazioni e della generalizzazione del modello.

Utilizzo

Per addestrare un modello CNN sul dataset ImageWoof per 100 epoch con un'immagine di dimensioni 224x224, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Varianti del set di dati

Il set di dati ImageWoof è disponibile in tre diverse dimensioni per soddisfare le varie esigenze di ricerca e le capacità di calcolo:

  1. Dimensione completa (imagewoof): Questa è la versione originale del dataset ImageWoof. Contiene immagini a grandezza naturale ed è ideale per l'addestramento finale e il benchmarking delle prestazioni.

  2. Dimensione media (imagewoof320): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 320 pixel. È adatta per un addestramento più rapido senza sacrificare in modo significativo le prestazioni del modello.

  3. Dimensioni ridotte (imagewoof160): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 160 pixel. È pensata per la prototipazione rapida e la sperimentazione in cui la velocità di formazione è una priorità.

Per utilizzare queste varianti nell'addestramento, è sufficiente sostituire "imagewoof" nell'argomento del dataset con "imagewoof320" o "imagewoof160". Ad esempio:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

È importante notare che l'utilizzo di immagini più piccole probabilmente produrrà prestazioni inferiori in termini di accuratezza della classificazione. Tuttavia, è un modo eccellente per iterare rapidamente nelle prime fasi di sviluppo del modello e di prototipazione.

Immagini di esempio e annotazioni

Il dataset ImageWoof contiene immagini colorate di varie razze di cani, fornendo un dataset impegnativo per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra le sottili differenze e somiglianze tra le diverse razze di cani nel dataset ImageWoof, evidenziando la complessità e la difficoltà del compito di classificazione.

Citazioni e ringraziamenti

Se utilizzi il dataset ImageWoof nel tuo lavoro di ricerca o sviluppo, assicurati di riconoscere i creatori del dataset collegandoti al repository ufficiale del dataset.

Desideriamo ringraziare il team di FastAI per aver creato e mantenuto il dataset ImageWoof come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per maggiori informazioni sul dataset ImageWoof, visita il repository del dataset ImageWoof.

DOMANDE FREQUENTI

Che cos'è il dataset ImageWoof in Ultralytics?

Il dataset ImageWoof è un impegnativo sottoinsieme di ImageNet incentrato su 10 razze canine specifiche. Creato per superare i limiti dei modelli di classificazione delle immagini, presenta razze come Beagle, Shih-Tzu e Golden Retriever. Il set di dati include immagini a varie risoluzioni (dimensioni reali, 320px, 160px) e anche etichette rumorose per ottenere scenari di addestramento più realistici. Questa complessità rende ImageWoof ideale per lo sviluppo di modelli di deep learning più avanzati.

Come posso addestrare un modello utilizzando il dataset ImageWoof con Ultralytics YOLO ?

Per addestrare un modello di rete neurale convoluzionale (CNN) sul dataset ImageWoof utilizzando Ultralytics YOLO per 100 epoche con una dimensione dell'immagine di 224x224, puoi utilizzare il seguente codice:

Esempio di treno

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Per maggiori dettagli sugli argomenti di formazione disponibili, consulta la pagina Formazione.

Quali versioni del dataset ImageWoof sono disponibili?

Il dataset ImageWoof è disponibile in tre dimensioni:

  1. Dimensioni complete (imagewoof): Ideale per la formazione finale e il benchmarking, contiene immagini a grandezza naturale.
  2. Dimensione media (imagewoof320): Immagini ridimensionate con una lunghezza massima dei bordi di 320 pixel, adatte a una formazione più rapida.
  3. Dimensioni ridotte (imagewoof160): Immagini ridimensionate con una lunghezza massima dei bordi di 160 pixel, perfette per la prototipazione rapida.

Usa queste versioni sostituendo "imagewoof" nell'argomento del dataset. Tieni presente, tuttavia, che le immagini più piccole possono produrre una minore accuratezza di classificazione, ma possono essere utili per eseguire iterazioni più rapide.

In che modo le etichette rumorose nel dataset ImageWoof favoriscono la formazione?

Le etichette rumorose del dataset ImageWoof simulano le condizioni del mondo reale in cui le etichette potrebbero non essere sempre accurate. L'addestramento dei modelli con questi dati aiuta a sviluppare la robustezza e la generalizzazione nei compiti di classificazione delle immagini. Questo prepara i modelli a gestire efficacemente dati ambigui o con etichette errate, come spesso accade nelle applicazioni pratiche.

Quali sono le sfide principali dell'utilizzo del set di dati ImageWoof?

La sfida principale del dataset ImageWoof risiede nelle sottili differenze tra le razze canine che include. Poiché si concentra su 10 razze strettamente correlate, la distinzione tra di esse richiede modelli di classificazione delle immagini più avanzati e perfezionati. Ciò rende ImageWoof un eccellente benchmark per testare le capacità e i miglioramenti dei modelli di deep learning.



Creato 2023-11-12, Aggiornato 2024-07-04
Autori: glenn-jocher (6)

Commenti