ImageWoof Dataset

De ImageWoof dataset is een subset van ImageNet bestaande uit 10 klassen die moeilijk te classificeren zijn, omdat het allemaal hondenrassen zijn. De dataset is gemaakt als een moeilijkere taak voor algoritmen voor beeldclassificatie om de ontwikkeling van geavanceerdere modellen aan te moedigen.

Belangrijkste kenmerken

ImageWoof bevat afbeeldingen van 10 verschillende hondenrassen: Australische terriër, Border terriër, Samojeed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever en Old English herdershond.
De dataset biedt afbeeldingen op verschillende resoluties (volledige grootte, 320px, 160px), zodat verschillende rekencapaciteiten en onderzoeksbehoeften mogelijk zijn.
Er is ook een versie met ruisende labels, die een realistischer scenario biedt waarin labels niet altijd betrouwbaar zijn.

Structuur dataset

De structuur van de ImageWoof dataset is gebaseerd op de hondenrasklassen, waarbij elk ras zijn eigen map met afbeeldingen heeft.

Toepassingen

De ImageWoof dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, vooral als het gaat om complexere en vergelijkbare klassen. De uitdaging van de dataset ligt in de subtiele verschillen tussen de hondenrassen, waardoor de grenzen van de prestaties en generalisatie van het model worden opgezocht.

Gebruik

Om een CNN-model te trainen op de ImageWoof dataset voor 100 epochs met een afbeeldingsgrootte van 224x224, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Dataset Varianten

ImageWoof dataset is verkrijgbaar in drie verschillende groottes om tegemoet te komen aan verschillende onderzoeksbehoeften en rekencapaciteiten:

Volledig formaat (imagewoof): Dit is de originele versie van de ImageWoof dataset. Deze bevat afbeeldingen op ware grootte en is ideaal voor eindtraining en prestatiebenchmarks.
Medium formaat (imagewoof320): Deze versie bevat afbeeldingen met een maximale randlengte van 320 pixels. Deze versie is geschikt voor snellere training zonder significant in te leveren op de prestaties van het model.
Klein formaat (imagewoof160): Deze versie bevat afbeeldingen met een maximale randlengte van 160 pixels. Het is ontworpen voor snelle prototypes en experimenten waarbij trainingssnelheid een prioriteit is.

Om deze varianten in je training te gebruiken, vervang je simpelweg 'imagewoof' in het dataset argument door 'imagewoof320' of 'imagewoof160'. Bijvoorbeeld:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

Het is belangrijk om op te merken dat het gebruik van kleinere afbeeldingen waarschijnlijk lagere prestaties zal opleveren in termen van classificatienauwkeurigheid. Het is echter een uitstekende manier om snel te itereren in de vroege stadia van modelontwikkeling en prototyping.

Voorbeeldafbeeldingen en -annotaties

De ImageWoof dataset bevat kleurrijke afbeeldingen van verschillende hondenrassen en vormt een uitdagende dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de subtiele verschillen en overeenkomsten zien tussen de verschillende hondenrassen in de ImageWoof dataset en benadrukt de complexiteit en moeilijkheid van de classificatietaak.

Citaten en erkenningen

Als je de ImageWoof dataset gebruikt in je onderzoek of ontwikkeling, zorg er dan voor dat je de makers van de dataset erkent door te linken naar de officiële dataset repository.

We willen graag het FastAI team bedanken voor het maken en onderhouden van de ImageWoof dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de ImageWoof dataset naar de ImageWoof dataset repository.

Gemaakt op 2023-11-12, Bijgewerkt op 2023-12-03
Auteurs: glenn-jocher (3)