Link to this sectionImageWoof-Datensatz#

Name: ImageWoof Bildklassifizierungs-Datensatz
Creator: fast.ai
License: https://www.image-net.org/download.php
Keywords: ImageWoof-Datensatz, ImageNet Teilsatz, Hunderassen, Bildklassifizierung, feinkörnige Klassifizierung, Deep Learning, Maschinelles Lernen, Ultralytics, verrauschte Labels

Der ImageWoof-Datensatz ist eine Teilmenge von ImageNet, die aus 10 Hunderassen besteht, die bewusst schwer voneinander zu unterscheiden sind. Er wurde von fast.ai als schwierigere Herausforderung für Algorithmen zur Bildklassifizierung entwickelt. Er enthält 12.954 Farbbilder – 9.025 für das Training und 3.929 für die Validierung – und umfasst Rassen wie Beagle, Shih-Tzu und Golden Retriever, was Modelle dazu zwingt, subtile, feinkörnige Unterschiede statt offensichtlicher Objektkategorien zu erkennen.

Link to this sectionHauptfunktionen#

ImageWoof enthält 12.954 Bilder von 10 Hunderassen: Australian Terrier, Border Terrier, Samojede, Beagle, Shih-Tzu, English Foxhound, Rhodesian Ridgeback, Dingo, Golden Retriever und Old English Sheepdog.
Er wird mit einer vordefinierten Aufteilung von 9.025 Trainings- und 3.929 Validierungsbildern ausgeliefert und ist in verschiedenen Auflösungen (Originalgröße, 320px, 160px) verfügbar, um unterschiedlichen Rechenbudgets gerecht zu werden.
Er enthält auch eine Version mit verrauschten Labels, die ein realistischeres Szenario bietet, in dem Labels nicht immer zuverlässig sind.

Link to this sectionDatensatzstruktur#

ImageWoof wird mit einer vordefinierten Trainings-/Validierungsaufteilung ausgeliefert, wobei jede Hunderasse in ihrem eigenen Ordner gespeichert ist:

Split	Bilder	Klassen
Trainieren	9.025	10
Validation	3.929	10

Da es sich bei allen 10 Klassen um Hunderassen handelt, ist die Aufteilung darauf ausgelegt, eine feinkörnige Klassifizierung zu testen – also die Unterscheidung optisch ähnlicher Kategorien –, anstatt die allgemeine Objekterkennung des vollständigen ImageNet-Datensatzes.

Link to this sectionAnwendungen#

Der ImageWoof-Datensatz wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen für komplexere und ähnlichere Klassen verwendet. Seine Herausforderung liegt in den subtilen Unterschieden zwischen den Hunderassen, was die Grenzen der Modellleistung und Verallgemeinerung ausreizt. Er ist besonders wertvoll für:

Benchmarking der Klassifizierungsleistung bei feinkörnigen Kategorien
Testen der Modellrobustheit gegenüber ähnlich aussehenden Klassen
Entwicklung von Algorithmen, die subtile visuelle Unterschiede unterscheiden können
Evaluierung von Transfer Learning von allgemeinen auf spezifische Domänen

Link to this sectionVerwendung#

Um ein Klassifizierungsmodell auf dem ImageWoof-Datensatz für 100 Epochen bei einer Bildgröße von 224x224 zu trainieren, verwende die untenstehenden Code-Schnipsel. Eine umfassende Liste der verfügbaren Argumente findest du auf der Modell-Training-Seite.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Link to this sectionDatensatzvarianten#

ImageWoof ist in drei Größen erhältlich, um unterschiedlichen Forschungsanforderungen und Rechenbudgets gerecht zu werden:

Full Size (imagewoof): Die Originalversion mit Bildern in voller Größe, ideal für das finale Training und Performance-Benchmarking.
Medium Size (imagewoof320): Bilder mit einer maximalen Kantenlänge von 320 Pixeln, geeignet für schnelleres Training, ohne die Modellleistung signifikant zu beeinträchtigen.
Small Size (imagewoof160): Bilder mit einer maximalen Kantenlänge von 160 Pixeln, konzipiert für schnelles Prototyping und Experimente, bei denen die Trainingsgeschwindigkeit Vorrang hat.

Um diese Varianten zu verwenden, ersetze einfach imagewoof im Datensatz-Argument durch imagewoof320 oder imagewoof160. Zum Beispiel:

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Beachte, dass kleinere Bilder wahrscheinlich zu einer geringeren Klassifizierungs-Genauigkeit führen, sie aber eine hervorragende Möglichkeit bieten, in den frühen Phasen der Modellentwicklung schnell zu iterieren. Du kannst Klassifizierungsdatensätze auch verwalten und das Training in der Cloud mit der Ultralytics Platform durchführen.

Link to this sectionBeispielbilder und Annotationen#

Der ImageWoof-Datensatz enthält farbenfrohe Bilder verschiedener Hunderassen und bietet einen herausfordernden Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele von Bildern aus dem Datensatz:

ImageWoof Hunderassen-Klassifizierungsdatensatz-Beispiele

Das Beispiel verdeutlicht die subtilen Unterschiede und Ähnlichkeiten zwischen den verschiedenen Hunderassen und unterstreicht die Komplexität und Schwierigkeit der Klassifizierungsaufgabe.

Link to this sectionZitate und Danksagungen#

Wenn du den ImageWoof-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, würdige bitte die Ersteller des Datensatzes, indem du auf das offizielle Datensatz-Repository verlinkst.

Wir möchten dem fast.ai-Team dafür danken, dass es ImageWoof als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft erstellt und gepflegt hat. Weitere Informationen über ImageWoof findest du im ImageWoof-Datensatz-Repository.

Link to this sectionFAQ#

Link to this sectionWas ist der ImageWoof-Datensatz in Ultralytics?#

Der ImageWoof-Datensatz ist eine herausfordernde Teilmenge von ImageNet, die sich auf 10 Hunderassen konzentriert und 12.954 Bilder enthält (9.025 Trainings- und 3.929 Validierungsbilder). Er wurde von fast.ai entwickelt, um die Grenzen von Bildklassifizierungsmodellen auszutesten, und umfasst Rassen wie Beagle, Shih-Tzu und Golden Retriever. Der Datensatz ist in verschiedenen Auflösungen (Originalgröße, 320px, 160px) verfügbar und enthält sogar verrauschte Labels für realistischere Trainingsszenarien, was ihn ideal für die Entwicklung fortschrittlicher Deep-Learning-Modelle macht.

Link to this sectionWie viele Bilder und Hunderassen enthält ImageWoof?#

ImageWoof enthält insgesamt 12.954 Bilder – 9.025 für das Training und 3.929 für die Validierung – von 10 Hunderassen: Australian Terrier, Border Terrier, Samojede, Beagle, Shih-Tzu, English Foxhound, Rhodesian Ridgeback, Dingo, Golden Retriever und Old English Sheepdog. Jede Rasse ist in ihrem eigenen Ordner gespeichert, gemäß dem Standard-Klassifizierungs-Layout, das Ultralytics erwartet.

Link to this sectionWie kann ich ein Modell mit dem ImageWoof-Datensatz mit Ultralytics YOLO trainieren?#

Um ein Klassifizierungsmodell auf dem ImageWoof-Datensatz mit Ultralytics YOLO für 100 Epochen bei einer Bildgröße von 224x224 zu trainieren, verwende den folgenden Code:

Trainingsbeispiel

from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Weitere Details zu verfügbaren Trainingsargumenten findest du auf der Training-Seite.

Link to this sectionWelche Versionen des ImageWoof-Datensatzes sind verfügbar?#

Der ImageWoof-Datensatz ist in drei Größen erhältlich:

Full Size (imagewoof): Ideal für das finale Training und Benchmarking, enthält Bilder in voller Größe.
Medium Size (imagewoof320): Skalierte Bilder mit einer maximalen Kantenlänge von 320 Pixeln, geeignet für schnelleres Training.
Small Size (imagewoof160): Skalierte Bilder mit einer maximalen Kantenlänge von 160 Pixeln, perfekt für schnelles Prototyping.

Verwende diese Versionen, indem du imagewoof im Datensatz-Argument entsprechend ersetzt. Beachte, dass kleinere Bilder zu einer geringeren Klassifizierungs-Genauigkeit führen können, aber für schnellere Iterationen nützlich sind.

Link to this sectionWie helfen verrauschte Labels im ImageWoof-Datensatz beim Training?#

Verrauschte Labels im ImageWoof-Datensatz simulieren reale Bedingungen, in denen Labels nicht immer korrekt sind. Das Training von Modellen mit diesen Daten hilft dabei, Robustheit und Verallgemeinerung bei Bildklassifizierungsaufgaben zu entwickeln. Es bereitet Modelle darauf vor, effektiv mit mehrdeutigen oder falsch gelabelten Daten umzugehen, wie sie oft in praktischen Anwendungen auftreten.

Link to this sectionWas sind die größten Herausforderungen bei der Nutzung des ImageWoof-Datensatzes?#

Die primäre Herausforderung von ImageWoof liegt in den subtilen Unterschieden zwischen den enthaltenen Hunderassen. Da er sich auf 10 eng verwandte Rassen konzentriert, erfordert die Unterscheidung fortgeschrittenere und fein abgestimmte Bildklassifizierungsmodelle. Dies macht ImageWoof zu einem exzellenten Benchmark, um die Fähigkeiten und Verbesserungen von Deep-Learning-Modellen zu testen.

Mitwirkende

GLglenn-jocher¹³ JKjk4e³ RAraimbekovm¹ HIhim2him2¹ MAMatthewNoyce¹ RIRizwanMunawar¹

Erstellt 12. Nov. 2023Aktualisiert vor 3 Tagen