Zum Inhalt springen

ImageWoof-Datensatz

Der ImageWoof-Datensatz ist eine Teilmenge des ImageNet, die aus 10 Klassen besteht, die schwierig zu klassifizieren sind, da es sich um Hunderassen handelt. Er wurde als schwierigere Aufgabe fĂŒr Bildklassifizierungsalgorithmen erstellt, um die Entwicklung fortschrittlicherer Modelle zu fördern.

Hauptmerkmale

  • ImageWoof enthĂ€lt Bilder von 10 verschiedenen Hunderassen: Australian Terrier, Border Terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian Ridgeback, Dingo, Golden Retriever und Old English sheepdog.
  • Der Datensatz enthĂ€lt Bilder in verschiedenen Auflösungen (volle GrĂ¶ĂŸe, 320px, 160px), um unterschiedlichen RechenkapazitĂ€ten und Forschungsanforderungen gerecht zu werden.
  • Es gibt auch eine Version mit verrauschten Etiketten, die ein realistischeres Szenario darstellt, in dem die Etiketten nicht immer zuverlĂ€ssig sind.

Struktur des Datensatzes

Die Struktur des ImageWoof-Datensatzes basiert auf den Klassen der Hunderassen, wobei jede Rasse ihr eigenes Verzeichnis mit Bildern hat.

Anwendungen

Der ImageWoof-Datensatz wird hĂ€ufig zum Trainieren und Evaluieren von Deep-Learning-Modellen fĂŒr Bildklassifizierungsaufgaben verwendet, insbesondere wenn es um komplexere und Ă€hnliche Klassen geht. Die Herausforderung des Datensatzes liegt in den feinen Unterschieden zwischen den Hunderassen, die die Leistung und Generalisierung der Modelle an ihre Grenzen bringen.

Verwendung

Um ein CNN-Modell auf dem ImageWoof-Datensatz fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 224x224 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Datensatz-Varianten

Den ImageWoof-Datensatz gibt es in drei verschiedenen GrĂ¶ĂŸen, um verschiedenen ForschungsbedĂŒrfnissen und RechenkapazitĂ€ten gerecht zu werden:

  1. Volle GrĂ¶ĂŸe (imagewoof): Dies ist die Originalversion des ImageWoof-Datensatzes. Er enthĂ€lt Bilder in voller GrĂ¶ĂŸe und ist ideal fĂŒr das abschließende Training und Leistungsvergleiche.

  2. Mittlere GrĂ¶ĂŸe (imagewoof320): Diese Version enthĂ€lt Bilder, die auf eine maximale KantenlĂ€nge von 320 Pixeln verkleinert wurden. Sie eignet sich fĂŒr ein schnelleres Training, ohne die Leistung des Modells wesentlich zu beeintrĂ€chtigen.

  3. Kleine GrĂ¶ĂŸe (imagewoof160): Diese Version enthĂ€lt Bilder, die auf eine maximale KantenlĂ€nge von 160 Pixeln verkleinert wurden. Sie ist fĂŒr Rapid Prototyping und Experimente gedacht, bei denen es auf Schnelligkeit ankommt.

Um diese Varianten in deinem Training zu verwenden, ersetze einfach "imagewoof" im Argument Datensatz durch "imagewoof320" oder "imagewoof160". Zum Beispiel:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

Es ist wichtig zu wissen, dass die Verwendung kleinerer Bilder wahrscheinlich zu einer geringeren Klassifizierungsgenauigkeit fĂŒhren wird. Es ist jedoch eine hervorragende Möglichkeit, um in den frĂŒhen Phasen der Modellentwicklung und des Prototypings schnell zu iterieren.

Beispielbilder und Anmerkungen

Der ImageWoof-Datensatz enthĂ€lt farbenfrohe Bilder verschiedener Hunderassen und stellt eine große Herausforderung fĂŒr die Bildklassifizierung dar. Hier sind einige Beispiele fĂŒr Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die subtilen Unterschiede und Ähnlichkeiten zwischen den verschiedenen Hunderassen im ImageWoof-Datensatz und verdeutlicht die KomplexitĂ€t und Schwierigkeit der Klassifizierungsaufgabe.

Zitate und Danksagungen

Wenn du den ImageWoof-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, stelle bitte sicher, dass du die Ersteller des Datensatzes anerkennst, indem du einen Link zum offiziellen Datensatz-Repository setzt.

Wir möchten dem FastAI-Team dafĂŒr danken, dass es den ImageWoof-Datensatz als wertvolle Ressource fĂŒr die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision erstellt und pflegt. Weitere Informationen ĂŒber den ImageWoof-Datensatz findest du im ImageWoof-Datensatz-Repository.



Erstellt am 2023-11-12, Aktualisiert am 2023-12-03
Autoren: glenn-jocher (3)

Kommentare