ImageWoof-Datensatz
Der ImageWoof-Datensatz ist eine Teilmenge des ImageNet, die aus 10 Klassen besteht, die schwierig zu klassifizieren sind, da es sich um Hunderassen handelt. Er wurde als schwierigere Aufgabe fĂŒr Bildklassifizierungsalgorithmen erstellt, um die Entwicklung fortschrittlicherer Modelle zu fördern.
Hauptmerkmale
- ImageWoof enthÀlt Bilder von 10 verschiedenen Hunderassen: Australian Terrier, Border Terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian Ridgeback, Dingo, Golden Retriever und Old English sheepdog.
- Der Datensatz enthĂ€lt Bilder in verschiedenen Auflösungen (volle GröĂe, 320px, 160px), um unterschiedlichen RechenkapazitĂ€ten und Forschungsanforderungen gerecht zu werden.
- Es gibt auch eine Version mit verrauschten Etiketten, die ein realistischeres Szenario darstellt, in dem die Etiketten nicht immer zuverlÀssig sind.
Struktur des Datensatzes
Die Struktur des ImageWoof-Datensatzes basiert auf den Klassen der Hunderassen, wobei jede Rasse ihr eigenes Verzeichnis mit Bildern hat.
Anwendungen
Der ImageWoof-Datensatz wird hĂ€ufig zum Trainieren und Evaluieren von Deep-Learning-Modellen fĂŒr Bildklassifizierungsaufgaben verwendet, insbesondere wenn es um komplexere und Ă€hnliche Klassen geht. Die Herausforderung des Datensatzes liegt in den feinen Unterschieden zwischen den Hunderassen, die die Leistung und Generalisierung der Modelle an ihre Grenzen bringen.
Verwendung
Um ein CNN-Modell auf dem ImageWoof-Datensatz fĂŒr 100 Epochen mit einer BildgröĂe von 224x224 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.
Beispiel fĂŒr einen Zug
Datensatz-Varianten
Den ImageWoof-Datensatz gibt es in drei verschiedenen GröĂen, um verschiedenen ForschungsbedĂŒrfnissen und RechenkapazitĂ€ten gerecht zu werden:
-
Volle GröĂe (imagewoof): Dies ist die Originalversion des ImageWoof-Datensatzes. Er enthĂ€lt Bilder in voller GröĂe und ist ideal fĂŒr das abschlieĂende Training und Leistungsvergleiche.
-
Mittlere GröĂe (imagewoof320): Diese Version enthĂ€lt Bilder, die auf eine maximale KantenlĂ€nge von 320 Pixeln verkleinert wurden. Sie eignet sich fĂŒr ein schnelleres Training, ohne die Leistung des Modells wesentlich zu beeintrĂ€chtigen.
-
Kleine GröĂe (imagewoof160): Diese Version enthĂ€lt Bilder, die auf eine maximale KantenlĂ€nge von 160 Pixeln verkleinert wurden. Sie ist fĂŒr Rapid Prototyping und Experimente gedacht, bei denen es auf Schnelligkeit ankommt.
Um diese Varianten in deinem Training zu verwenden, ersetze einfach "imagewoof" im Argument Datensatz durch "imagewoof320" oder "imagewoof160". Zum Beispiel:
from ultralytics import YOLO
# Load a model
model = YOLO('yolov8n-cls.pt') # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)
# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)
Es ist wichtig zu wissen, dass die Verwendung kleinerer Bilder wahrscheinlich zu einer geringeren Klassifizierungsgenauigkeit fĂŒhren wird. Es ist jedoch eine hervorragende Möglichkeit, um in den frĂŒhen Phasen der Modellentwicklung und des Prototypings schnell zu iterieren.
Beispielbilder und Anmerkungen
Der ImageWoof-Datensatz enthĂ€lt farbenfrohe Bilder verschiedener Hunderassen und stellt eine groĂe Herausforderung fĂŒr die Bildklassifizierung dar. Hier sind einige Beispiele fĂŒr Bilder aus diesem Datensatz:
Das Beispiel zeigt die subtilen Unterschiede und Ăhnlichkeiten zwischen den verschiedenen Hunderassen im ImageWoof-Datensatz und verdeutlicht die KomplexitĂ€t und Schwierigkeit der Klassifizierungsaufgabe.
Zitate und Danksagungen
Wenn du den ImageWoof-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, stelle bitte sicher, dass du die Ersteller des Datensatzes anerkennst, indem du einen Link zum offiziellen Datensatz-Repository setzt.
Wir möchten dem FastAI-Team dafĂŒr danken, dass es den ImageWoof-Datensatz als wertvolle Ressource fĂŒr die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision erstellt und pflegt. Weitere Informationen ĂŒber den ImageWoof-Datensatz findest du im ImageWoof-Datensatz-Repository.