ImageWoof-Datensatz

Q: What is the ImageWoof dataset in Ultralytics?

Der ImageWoof-Datensatz ist eine anspruchsvolle Teilmenge von ImageNet, die sich auf 10 bestimmte Hunderassen konzentriert. Er wurde erstellt, um die Grenzen von Bildklassifizierungsmodellen zu erweitern, und umfasst Rassen wie Beagle, Shih-Tzu und Golden Retriever. Der Datensatz enthält Bilder in verschiedenen Auflösungen (volle Größe, 320px, 160px) und sogar verrauschte Labels für realistischere Trainingsszenarien. Diese Komplexität macht ImageWoof ideal für die Entwicklung fortgeschrittener Deep-Learning-Modelle.

Q: What versions of the ImageWoof dataset are available?

Den ImageWoof-Datensatz gibt es in drei Größen: Verwende diese Versionen, indem du "imagewoof" im Argument dataset entsprechend ersetzst. Beachte jedoch, dass kleinere Bilder eine geringere Klassifizierungsgenauigkeit ergeben können, aber für schnellere Iterationen nützlich sein können.

Der ImageWoof-Datensatz ist eine Teilmenge des ImageNet, die aus 10 Klassen besteht, die schwierig zu klassifizieren sind, da es sich um Hunderassen handelt. Er wurde als schwierigere Aufgabe für Bildklassifizierungsalgorithmen erstellt, um die Entwicklung fortschrittlicherer Modelle zu fördern.

Hauptmerkmale

ImageWoof enthält Bilder von 10 verschiedenen Hunderassen: Australian Terrier, Border Terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian Ridgeback, Dingo, Golden Retriever und Old English sheepdog.
Der Datensatz enthält Bilder in verschiedenen Auflösungen (volle Größe, 320px, 160px), um unterschiedlichen Rechenkapazitäten und Forschungsanforderungen gerecht zu werden.
Es gibt auch eine Version mit verrauschten Etiketten, die ein realistischeres Szenario darstellt, in dem die Etiketten nicht immer zuverlässig sind.

Struktur des Datensatzes

Die Struktur des ImageWoof-Datensatzes basiert auf den Klassen der Hunderassen, wobei jede Rasse ihr eigenes Verzeichnis mit Bildern hat.

Anwendungen

Der ImageWoof-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, insbesondere wenn es um komplexere und ähnliche Klassen geht. Die Herausforderung des Datensatzes liegt in den feinen Unterschieden zwischen den Hunderassen, die die Leistung und Generalisierung der Modelle an ihre Grenzen bringen.

Verwendung

Um ein CNN-Modell auf dem ImageWoof-Datensatz für 100 Epochen mit einer Bildgröße von 224x224 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Modelltraining.

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Datensatz-Varianten

Den ImageWoof-Datensatz gibt es in drei verschiedenen Größen, um verschiedenen Forschungsbedürfnissen und Rechenkapazitäten gerecht zu werden:

Volle Größe (imagewoof): Dies ist die Originalversion des ImageWoof-Datensatzes. Er enthält Bilder in voller Größe und ist ideal für das abschließende Training und Leistungsvergleiche.
Mittlere Größe (imagewoof320): Diese Version enthält Bilder, die auf eine maximale Kantenlänge von 320 Pixeln verkleinert wurden. Sie eignet sich für ein schnelleres Training, ohne die Leistung des Modells wesentlich zu beeinträchtigen.
Kleine Größe (imagewoof160): Diese Version enthält Bilder, die auf eine maximale Kantenlänge von 160 Pixeln verkleinert wurden. Sie ist für Rapid Prototyping und Experimente gedacht, bei denen es auf Schnelligkeit ankommt.

Um diese Varianten in deinem Training zu verwenden, ersetze einfach "imagewoof" im Argument Datensatz durch "imagewoof320" oder "imagewoof160". Zum Beispiel:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Es ist wichtig zu wissen, dass die Verwendung kleinerer Bilder wahrscheinlich zu einer geringeren Klassifizierungsgenauigkeit führen wird. Es ist jedoch eine hervorragende Möglichkeit, um in den frühen Phasen der Modellentwicklung und des Prototypings schnell zu iterieren.

Beispielbilder und Anmerkungen

Der ImageWoof-Datensatz enthält farbenfrohe Bilder verschiedener Hunderassen und stellt eine große Herausforderung für die Bildklassifizierung dar. Hier sind einige Beispiele für Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die subtilen Unterschiede und Ähnlichkeiten zwischen den verschiedenen Hunderassen im ImageWoof-Datensatz und verdeutlicht die Komplexität und Schwierigkeit der Klassifizierungsaufgabe.

Zitate und Danksagungen

Wenn du den ImageWoof-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, stelle bitte sicher, dass du die Ersteller des Datensatzes anerkennst, indem du einen Link zum offiziellen Datensatz-Repository setzt.

Wir möchten dem FastAI-Team dafür danken, dass es den ImageWoof-Datensatz als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision erstellt und pflegt. Weitere Informationen über den ImageWoof-Datensatz findest du im ImageWoof-Datensatz-Repository.

FAQ

Was ist der ImageWoof-Datensatz in Ultralytics?

Der ImageWoof-Datensatz ist eine anspruchsvolle Teilmenge des ImageNet, die sich auf 10 bestimmte Hunderassen konzentriert. Er wurde erstellt, um die Grenzen von Bildklassifizierungsmodellen zu erweitern, und umfasst Rassen wie Beagle, Shih-Tzu und Golden Retriever. Der Datensatz enthält Bilder in verschiedenen Auflösungen (volle Größe, 320px, 160px) und sogar verrauschte Labels für realistischere Trainingsszenarien. Diese Komplexität macht ImageWoof ideal für die Entwicklung fortgeschrittener Deep-Learning-Modelle.

Wie kann ich ein Modell mit dem ImageWoof-Datensatz mit Ultralytics YOLO trainieren?

Um ein Convolutional Neural Network (CNN)-Modell auf dem ImageWoof-Datensatz mit Ultralytics YOLO für 100 Epochen bei einer Bildgröße von 224x224 zu trainieren, kannst du den folgenden Code verwenden:

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Weitere Informationen zu den verfügbaren Schulungsargumenten findest du auf der Seite Schulung.

Welche Versionen des ImageWoof-Datensatzes gibt es?

Der ImageWoof-Datensatz ist in drei Größen erhältlich:

Volle Größe (imagewoof): Ideal für das Abschlusstraining und Benchmarking, mit Bildern in voller Größe.
Mittlere Größe (imagewoof320): Verkleinerte Bilder mit einer maximalen Kantenlänge von 320 Pixeln, geeignet für schnelleres Training.
Kleine Größe (imagewoof160): Verkleinerte Bilder mit einer maximalen Kantenlänge von 160 Pixeln, perfekt für Rapid Prototyping.

Verwende diese Versionen, indem du "imagewoof" im Argument dataset entsprechend ersetzst. Beachte jedoch, dass kleinere Bilder eine geringere Klassifizierungsgenauigkeit ergeben können, aber für schnellere Iterationen nützlich sein können.

Wie profitieren die verrauschten Labels im ImageWoof-Datensatz vom Training?

Verrauschte Beschriftungen im ImageWoof-Datensatz simulieren reale Bedingungen, in denen die Beschriftungen nicht immer korrekt sind. Das Training von Modellen mit diesen Daten hilft, die Robustheit und Generalisierung von Bildklassifizierungsaufgaben zu verbessern. So werden die Modelle darauf vorbereitet, mit mehrdeutigen oder falsch beschrifteten Daten effektiv umzugehen, wie es in der Praxis häufig der Fall ist.

Was sind die wichtigsten Herausforderungen bei der Nutzung des ImageWoof-Datensatzes?

Die größte Herausforderung des ImageWoof-Datensatzes liegt in den feinen Unterschieden zwischen den Hunderassen, die er enthält. Da er sich auf 10 eng verwandte Rassen konzentriert, erfordert die Unterscheidung zwischen ihnen fortschrittlichere und feiner abgestimmte Bildklassifizierungsmodelle. Das macht ImageWoof zu einem hervorragenden Benchmark, um die Fähigkeiten und Verbesserungen von Deep Learning-Modellen zu testen.

Erstellt am 2023-11-12, Aktualisiert am 2024-07-04
Autoren: glenn-jocher (6)