Vai al contenuto

Set di dati ImageWoof

Il set di dati ImageWoof è un sottoinsieme di ImageNet composto da 10 classi difficili da classificare, poiché sono tutte razze di cani. È stato creato come compito più difficile da risolvere per gli algoritmi di classificazione delle immagini, con l'obiettivo di incoraggiare lo sviluppo di modelli più avanzati.

Caratteristiche principali

  • ImageWoof contiene immagini di 10 razze canine diverse: Australian terrier, Border terrier, Samoiedo, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
  • Il set di dati fornisce immagini a varie risoluzioni (dimensioni reali, 320px, 160px), per soddisfare le diverse capacità di calcolo e le esigenze di ricerca.
  • Include anche una versione con etichette rumorose, che fornisce uno scenario più realistico in cui le etichette potrebbero non essere sempre affidabili.

Struttura del set di dati

La struttura del set di dati ImageWoof si basa sulle classi di razze canine, con ogni razza che ha una propria directory di immagini.

Applicazioni

Il dataset ImageWoof è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione di immagini, soprattutto quando si tratta di classi più complesse e simili. La sfida del dataset risiede nelle sottili differenze tra le razze canine, che spingono i limiti delle prestazioni e della generalizzazione del modello.

Utilizzo

Per addestrare un modello CNN sul dataset ImageWoof per 100 epoche con un'immagine di dimensioni 224x224, si possono usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Varianti del set di dati

Il set di dati ImageWoof è disponibile in tre diverse dimensioni per soddisfare le varie esigenze di ricerca e le capacità di calcolo:

  1. Dimensione completa (imagewoof): È la versione originale del dataset ImageWoof. Contiene immagini a grandezza naturale ed è ideale per l'addestramento finale e il benchmarking delle prestazioni.

  2. Dimensione media (imagewoof320): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 320 pixel. È adatta per un addestramento più rapido senza sacrificare significativamente le prestazioni del modello.

  3. Dimensioni ridotte (imagewoof160): Questa versione contiene immagini ridimensionate per avere una lunghezza massima dei bordi di 160 pixel. È pensata per la prototipazione rapida e la sperimentazione, dove la velocità di formazione è una priorità.

Per utilizzare queste varianti nell'addestramento, è sufficiente sostituire "imagewoof" nell'argomento del set di dati con "imagewoof320" o "imagewoof160". Ad esempio:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the small-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

È importante notare che l'uso di immagini più piccole probabilmente produrrà prestazioni inferiori in termini di accuratezza della classificazione. Tuttavia, è un modo eccellente per iterare rapidamente nelle prime fasi di sviluppo e prototipazione del modello.

Immagini di esempio e annotazioni

Il set di dati ImageWoof contiene immagini colorate di varie razze di cani, fornendo un set di dati impegnativo per i compiti di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra le sottili differenze e somiglianze tra le diverse razze di cani nel dataset ImageWoof, evidenziando la complessità e la difficoltà del compito di classificazione.

Citazioni e ringraziamenti

Se utilizzate il dataset ImageWoof nel vostro lavoro di ricerca o sviluppo, assicuratevi di riconoscere i creatori del dataset collegandovi al repository ufficiale del dataset.

Desideriamo ringraziare il team FastAI per aver creato e mantenuto il dataset ImageWoof come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul dataset ImageWoof, visitare il repository del dataset ImageWoof.

FAQ

Che cos'è il dataset ImageWoof in Ultralytics?

Il set di dati ImageWoof è un sottoinsieme impegnativo di ImageNet che si concentra su 10 razze canine specifiche. Creato per superare i limiti dei modelli di classificazione delle immagini, presenta razze come Beagle, Shih-Tzu e Golden Retriever. Il set di dati include immagini a varie risoluzioni (dimensioni reali, 320px, 160px) e persino etichette rumorose per scenari di addestramento più realistici. Questa complessità rende ImageWoof ideale per lo sviluppo di modelli di deep learning più avanzati.

Come posso addestrare un modello utilizzando il dataset ImageWoof con Ultralytics YOLO ?

Per addestrare un modello di rete neurale convoluzionale (CNN) sul dataset ImageWoof utilizzando Ultralytics YOLO per 100 epoche con una dimensione dell'immagine di 224x224, è possibile utilizzare il seguente codice:

Esempio di treno

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Per maggiori dettagli sugli argomenti di formazione disponibili, consultare la pagina Formazione.

Quali versioni del dataset ImageWoof sono disponibili?

Il set di dati ImageWoof è disponibile in tre dimensioni:

  1. Dimensione completa (imagewoof): Ideale per la formazione finale e il benchmarking, contiene immagini a grandezza naturale.
  2. Dimensione media (imagewoof320): Immagini ridimensionate con una lunghezza massima dei bordi di 320 pixel, adatte a un addestramento più rapido.
  3. Dimensioni ridotte (imagewoof160): Immagini ridimensionate con una lunghezza massima dei bordi di 160 pixel, perfette per la prototipazione rapida.

Utilizzare queste versioni sostituendo "imagewoof" nell'argomento del set di dati. Si noti, tuttavia, che le immagini più piccole possono produrre una minore accuratezza di classificazione, ma possono essere utili per iterazioni più rapide.

In che modo le etichette rumorose nel dataset ImageWoof favoriscono la formazione?

Le etichette rumorose del dataset ImageWoof simulano le condizioni del mondo reale, dove le etichette potrebbero non essere sempre accurate. L'addestramento dei modelli con questi dati aiuta a sviluppare robustezza e generalizzazione nei compiti di classificazione delle immagini. Questo prepara i modelli a gestire efficacemente dati ambigui o con etichette errate, come spesso accade nelle applicazioni pratiche.

Quali sono le sfide principali dell'utilizzo del dataset ImageWoof?

La sfida principale del dataset ImageWoof risiede nelle sottili differenze tra le razze canine che include. Poiché si concentra su 10 razze strettamente correlate, la distinzione tra di esse richiede modelli di classificazione delle immagini più avanzati e perfezionati. Ciò rende ImageWoof un eccellente benchmark per testare le capacità e i miglioramenti dei modelli di deep learning.

📅C reato 1 anno fa ✏️ Aggiornato 2 mesi fa

Commenti