Zum Inhalt springen

ImageWoof-Datensatz

Der ImageWoof-Datensatz ist eine Teilmenge des ImageNet, die aus 10 Klassen besteht, die schwierig zu klassifizieren sind, da es sich um Hunderassen handelt. Er wurde als schwierigere Aufgabe für Bildklassifizierungsalgorithmen erstellt, um die Entwicklung fortschrittlicherer Modelle zu fördern.

Wesentliche Merkmale

  • ImageWoof enthält Bilder von 10 verschiedenen Hunderassen: Australian Terrier, Border Terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden Retriever und Old English sheepdog.
  • Der Datensatz enthält Bilder in verschiedenen Auflösungen (volle Größe, 320px, 160px), um den unterschiedlichen Rechenkapazitäten und Forschungsanforderungen gerecht zu werden.
  • Es gibt auch eine Version mit verrauschten Etiketten, die ein realistischeres Szenario darstellt, in dem die Etiketten nicht immer zuverlässig sind.

Struktur des Datensatzes

Die Struktur des ImageWoof-Datensatzes basiert auf den Klassen der Hunderassen, wobei jede Rasse ihr eigenes Verzeichnis mit Bildern hat.

Anwendungen

Der ImageWoof-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, insbesondere wenn es um komplexere und ähnliche Klassen geht. Die Herausforderung des Datensatzes liegt in den feinen Unterschieden zwischen den Hunderassen, die die Leistung und Generalisierung des Modells an die Grenzen bringen.

Verwendung

Um ein CNN-Modell auf dem ImageWoof-Datensatz für 100 Epochen mit einer Bildgröße von 224x224 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Varianten des Datensatzes

Der ImageWoof-Datensatz ist in drei verschiedenen Größen erhältlich, um verschiedenen Forschungsanforderungen und Rechenkapazitäten gerecht zu werden:

  1. Volle Größe (imagewoof): Dies ist die Originalversion des ImageWoof-Datensatzes. Er enthält Bilder in voller Größe und ist ideal für das abschließende Training und Leistungsvergleiche.

  2. Mittlere Größe (imagewoof320): Diese Version enthält Bilder, die auf eine maximale Kantenlänge von 320 Pixeln verkleinert wurden. Sie eignet sich für ein schnelleres Training, ohne die Modellleistung wesentlich zu beeinträchtigen.

  3. Kleine Größe (imagewoof160): Diese Version enthält Bilder, die auf eine maximale Kantenlänge von 160 Pixeln verkleinert wurden. Sie wurde für Rapid Prototyping und Experimente entwickelt, bei denen die Trainingsgeschwindigkeit eine Priorität ist.

Um diese Varianten in Ihrem Training zu verwenden, ersetzen Sie einfach 'imagewoof' im Argument dataset durch 'imagewoof320' oder 'imagewoof160'. Zum Beispiel:

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the small-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Es ist wichtig zu beachten, dass die Verwendung kleinerer Bilder wahrscheinlich zu einer geringeren Klassifizierungsgenauigkeit führt. Es ist jedoch eine hervorragende Möglichkeit, in den frühen Phasen der Modellentwicklung und des Prototypings schnell zu iterieren.

Beispielbilder und -kommentare

Der ImageWoof-Datensatz enthält farbenfrohe Bilder verschiedener Hunderassen und stellt damit einen anspruchsvollen Datensatz für Bildklassifizierungsaufgaben dar. Hier sind einige Beispiele von Bildern aus dem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die subtilen Unterschiede und Ähnlichkeiten zwischen den verschiedenen Hunderassen im ImageWoof-Datensatz und verdeutlicht die Komplexität und Schwierigkeit der Klassifizierungsaufgabe.

Zitate und Danksagungen

Wenn Sie den ImageWoof-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, stellen Sie bitte sicher, dass Sie die Schöpfer des Datensatzes anerkennen, indem Sie einen Link zum offiziellen Datensatz-Repository setzen.

Wir möchten dem FastAI-Team für die Erstellung und Pflege des ImageWoof-Datensatzes danken, der eine wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision darstellt. Weitere Informationen über den ImageWoof-Datensatz finden Sie im ImageWoof-Datensatz-Repository.

FAQ

Was ist der ImageWoof-Datensatz in Ultralytics?

Der ImageWoof-Datensatz ist eine anspruchsvolle Teilmenge von ImageNet, die sich auf 10 bestimmte Hunderassen konzentriert. Er wurde erstellt, um die Grenzen von Bildklassifizierungsmodellen zu erweitern, und umfasst Rassen wie Beagle, Shih-Tzu und Golden Retriever. Der Datensatz enthält Bilder in verschiedenen Auflösungen (volle Größe, 320px, 160px) und sogar verrauschte Etiketten für realistischere Trainingsszenarien. Diese Komplexität macht ImageWoof ideal für die Entwicklung fortgeschrittener Deep-Learning-Modelle.

Wie kann ich ein Modell mit dem ImageWoof-Datensatz mit Ultralytics YOLO trainieren?

Um ein Convolutional Neural Network (CNN)-Modell auf dem ImageWoof-Datensatz mit Ultralytics YOLO für 100 Epochen bei einer Bildgröße von 224x224 zu trainieren, können Sie den folgenden Code verwenden:

Beispiel für einen Zug

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Weitere Einzelheiten zu den verfügbaren Schulungsargumenten finden Sie auf der Seite Schulung.

Welche Versionen des ImageWoof-Datensatzes sind verfügbar?

Der ImageWoof-Datensatz ist in drei Größen erhältlich:

  1. Volle Größe (imagewoof): Ideal für abschließendes Training und Benchmarking, mit Bildern in voller Größe.
  2. Mittlere Größe (imagewoof320): Geänderte Bilder mit einer maximalen Kantenlänge von 320 Pixeln, geeignet für schnelleres Training.
  3. Kleine Größe (imagewoof160): Verkleinerte Bilder mit einer maximalen Kantenlänge von 160 Pixeln, ideal für Rapid Prototyping.

Verwenden Sie diese Versionen, indem Sie "imagewoof" im Argument dataset entsprechend ersetzen. Beachten Sie jedoch, dass kleinere Bilder eine geringere Klassifizierungsgenauigkeit ergeben können, aber für schnellere Iterationen nützlich sein können.

Welchen Nutzen haben verrauschte Beschriftungen im ImageWoof-Datensatz für das Training?

Die verrauschten Beschriftungen im ImageWoof-Datensatz simulieren reale Bedingungen, in denen die Beschriftungen möglicherweise nicht immer korrekt sind. Das Training von Modellen mit diesen Daten hilft bei der Entwicklung von Robustheit und Generalisierung bei Bildklassifizierungsaufgaben. Dadurch werden die Modelle darauf vorbereitet, mit mehrdeutigen oder falsch beschrifteten Daten effektiv umzugehen, was in praktischen Anwendungen häufig vorkommt.

Was sind die größten Herausforderungen bei der Verwendung des ImageWoof-Datensatzes?

Die größte Herausforderung des ImageWoof-Datensatzes liegt in den feinen Unterschieden zwischen den darin enthaltenen Hunderassen. Da er sich auf 10 eng verwandte Rassen konzentriert, erfordert die Unterscheidung zwischen ihnen fortschrittlichere und fein abgestimmte Bildklassifizierungsmodelle. Dies macht ImageWoof zu einem hervorragenden Benchmark, um die Fähigkeiten und Verbesserungen von Deep-Learning-Modellen zu testen.

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 2 Monaten

Kommentare