Overslaan naar inhoud

ImageWoof Dataset

De ImageWoof dataset is een subset van ImageNet bestaande uit 10 klassen die moeilijk te classificeren zijn, omdat het allemaal hondenrassen zijn. De dataset is gemaakt als een moeilijkere taak voor algoritmen voor beeldclassificatie om de ontwikkeling van geavanceerdere modellen aan te moedigen.

Belangrijkste kenmerken

  • ImageWoof bevat afbeeldingen van 10 verschillende hondenrassen: Australische terriĆ«r, Border terriĆ«r, Samojeed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever en Old English herdershond.
  • De dataset biedt afbeeldingen op verschillende resoluties (volledige grootte, 320px, 160px), zodat verschillende rekencapaciteiten en onderzoeksbehoeften mogelijk zijn.
  • Er is ook een versie met ruisende labels, die een realistischer scenario biedt waarin labels niet altijd betrouwbaar zijn.

Structuur dataset

De structuur van de ImageWoof dataset is gebaseerd op de hondenrasklassen, waarbij elk ras zijn eigen map met afbeeldingen heeft.

Toepassingen

De ImageWoof dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, vooral als het gaat om complexere en vergelijkbare klassen. De uitdaging van de dataset ligt in de subtiele verschillen tussen de hondenrassen, waardoor de grenzen van de prestaties en generalisatie van het model worden opgezocht.

Gebruik

Om een CNN-model te trainen op de ImageWoof dataset voor 100 epochs met een afbeeldingsgrootte van 224x224, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Dataset Varianten

ImageWoof dataset is verkrijgbaar in drie verschillende groottes om tegemoet te komen aan verschillende onderzoeksbehoeften en rekencapaciteiten:

  1. Volledig formaat (imagewoof): Dit is de originele versie van de ImageWoof dataset. Deze bevat afbeeldingen op ware grootte en is ideaal voor eindtraining en prestatiebenchmarks.

  2. Medium formaat (imagewoof320): Deze versie bevat afbeeldingen met een maximale randlengte van 320 pixels. Deze versie is geschikt voor snellere training zonder significant in te leveren op de prestaties van het model.

  3. Klein formaat (imagewoof160): Deze versie bevat afbeeldingen met een maximale randlengte van 160 pixels. Het is ontworpen voor snelle prototypes en experimenten waarbij trainingssnelheid een prioriteit is.

Om deze varianten in je training te gebruiken, vervang je simpelweg 'imagewoof' in het dataset argument door 'imagewoof320' of 'imagewoof160'. Bijvoorbeeld:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Het is belangrijk om op te merken dat het gebruik van kleinere afbeeldingen waarschijnlijk lagere prestaties zal opleveren in termen van classificatienauwkeurigheid. Het is echter een uitstekende manier om snel te itereren in de vroege stadia van modelontwikkeling en prototyping.

Voorbeeldafbeeldingen en -annotaties

De ImageWoof dataset bevat kleurrijke afbeeldingen van verschillende hondenrassen en vormt een uitdagende dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de subtiele verschillen en overeenkomsten zien tussen de verschillende hondenrassen in de ImageWoof dataset en benadrukt de complexiteit en moeilijkheid van de classificatietaak.

Citaten en erkenningen

Als je de ImageWoof dataset gebruikt in je onderzoek of ontwikkeling, zorg er dan voor dat je de makers van de dataset erkent door te linken naar de officiƫle dataset repository.

We willen graag het FastAI team bedanken voor het maken en onderhouden van de ImageWoof dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de ImageWoof dataset naar de ImageWoof dataset repository.

FAQ

Wat is de ImageWoof dataset in Ultralytics?

De ImageWoof dataset is een uitdagende subset van ImageNet die zich richt op 10 specifieke hondenrassen. De dataset is gemaakt om de grenzen van beeldclassificatiemodellen op te zoeken en bevat rassen als Beagle, Shih-Tzu en Golden Retriever. De dataset bevat afbeeldingen op verschillende resoluties (volledige grootte, 320px, 160px) en zelfs ruisende labels voor realistischere trainingsscenario's. Deze complexiteit maakt ImageWoof ideaal voor het ontwikkelen van meer geavanceerde deep learning modellen.

Hoe kan ik een model trainen met de ImageWoof dataset met Ultralytics YOLO ?

Om een Convolutional Neural Network (CNN) model te trainen op de ImageWoof dataset met Ultralytics YOLO voor 100 epochs bij een afbeeldingsgrootte van 224x224, kun je de volgende code gebruiken:

Voorbeeld trein

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Raadpleeg de pagina Training voor meer informatie over beschikbare trainingsargumenten.

Welke versies van de ImageWoof dataset zijn beschikbaar?

De ImageWoof dataset is er in drie formaten:

  1. Volledig formaat (imagewoof): Ideaal voor eindtraining en benchmarking, bevat afbeeldingen op ware grootte.
  2. Medium formaat (imagewoof320): Aangepaste afbeeldingen met een maximale randlengte van 320 pixels, geschikt voor snellere training.
  3. Klein formaat (imagewoof160): Aangepaste afbeeldingen met een maximale randlengte van 160 pixels, perfect voor snelle prototypes.

Gebruik deze versies door 'imagewoof' in het dataset argument dienovereenkomstig te vervangen. Merk echter op dat kleinere afbeeldingen een lagere classificatienauwkeurigheid kunnen opleveren, maar nuttig kunnen zijn voor snellere iteraties.

Wat is het voordeel van luidruchtige labels in de ImageWoof dataset voor training?

Lawaaiige labels in de ImageWoof dataset simuleren echte omstandigheden waarin labels niet altijd accuraat zijn. Het trainen van modellen met deze data helpt bij het ontwikkelen van robuustheid en generalisatie in beeldclassificatietaken. Dit bereidt de modellen voor om effectief om te gaan met dubbelzinnige of verkeerd gelabelde gegevens, die vaak voorkomen in praktische toepassingen.

Wat zijn de belangrijkste uitdagingen bij het gebruik van de ImageWoof dataset?

De belangrijkste uitdaging van de ImageWoof dataset ligt in de subtiele verschillen tussen de hondenrassen. Omdat het zich richt op 10 nauw verwante rassen, vereist het onderscheid tussen deze rassen meer geavanceerde en verfijnde beeldclassificatiemodellen. Dit maakt ImageWoof een uitstekende benchmark om de mogelijkheden en verbeteringen van deep learning modellen te testen.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-07-04
Auteurs: glenn-jocher (6)

Reacties