Zum Inhalt springen

Fashion-MNIST-Datensatz

Der Fashion-MNIST-Datensatz ist eine Datenbank mit Artikelbildern von Zalando, die aus einer Trainingsmenge von 60.000 Beispielen und einer Testmenge von 10.000 Beispielen besteht. Jedes Beispiel ist ein 28x28 Graustufenbild, das mit einem Label aus 10 Klassen verknüpft ist. Fashion-MNIST soll als direkter Ersatz für den ursprünglichen MNIST-Datensatz dienen, um Algorithmen für maschinelles Lernen zu testen.



Pass auf: Bildklassifizierung im MNIST-Datensatz für Mode mit Ultralytics YOLOv8

Hauptmerkmale

  • Fashion-MNIST enthält 60.000 Trainingsbilder und 10.000 Testbilder der Zalando-Artikelbilder.
  • Der Datensatz umfasst Graustufenbilder der Größe 28x28 Pixel.
  • Jedem Pixel ist ein einzelner Pixelwert zugeordnet, der die Helligkeit oder Dunkelheit dieses Pixels angibt, wobei höhere Zahlen dunkler bedeuten. Dieser Pixelwert ist eine ganze Zahl zwischen 0 und 255.
  • Fashion-MNIST wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Bildklassifizierungsaufgaben.

Struktur des Datensatzes

Der Fashion-MNIST-Datensatz ist in zwei Teilmengen aufgeteilt:

  1. Training Set: Diese Teilmenge enthält 60.000 Bilder, die für das Training von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Vergleichen der trainierten Modelle verwendet werden.

Etiketten

Jedes Trainings- und Testbeispiel wird einem der folgenden Labels zugewiesen:

  1. T-shirt/Top
  2. Hose
  3. Pullover
  4. Kleid
  5. Mantel
  6. Sandale
  7. Hemd
  8. Sneaker
  9. Tasche
  10. Stiefelette

Anwendungen

Der Fashion-MNIST-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Das einfache und gut strukturierte Format des Datensatzes macht ihn zu einer unverzichtbaren Ressource für Forscher/innen und Praktiker/innen auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein CNN-Modell auf dem Fashion-MNIST-Datensatz für 100 Epochen mit einer Bildgröße von 28x28 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Beispielbilder und Anmerkungen

Der Fashion-MNIST-Datensatz enthält Graustufenbilder der Zalando-Artikelbilder und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im Fashion-MNIST-Datensatz und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifizierungsmodelle ist.

Danksagungen

Wenn du den Fashion-MNIST-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, erwähne den Datensatz bitte, indem du auf das GitHub-Repository verlinkst. Dieser Datensatz wurde von Zalando Research zur Verfügung gestellt.

FAQ

Was ist der Fashion-MNIST-Datensatz und wie unterscheidet er sich von MNIST?

Der Fashion-MNIST-Datensatz ist eine Sammlung von 70.000 Graustufenbildern der Zalando-Artikelbilder, die als moderner Ersatz für den ursprünglichen MNIST-Datensatz gedacht ist. Er dient als Benchmark für maschinelle Lernmodelle im Zusammenhang mit Bildklassifizierungsaufgaben. Im Gegensatz zu MNIST, das handgeschriebene Ziffern enthält, besteht Fashion-MNIST aus 28x28-Pixel-Bildern, die in 10 modebezogene Klassen eingeteilt sind, z. B. T-Shirt/Top, Hose und Stiefelette.

Wie kann ich ein YOLO Modell mit dem Fashion-MNIST-Datensatz trainieren?

Um ein Ultralytics YOLO Modell auf dem Fashion-MNIST-Datensatz zu trainieren, kannst du die Befehle Python und CLI verwenden. Hier ist ein kurzes Beispiel, das dir den Einstieg erleichtert:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov8n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Genauere Informationen zu den Trainingsparametern findest du auf der Seite Training.

Warum sollte ich den Fashion-MNIST-Datensatz für das Benchmarking meiner Machine-Learning-Modelle verwenden?

Der Fashion-MNIST-Datensatz ist in der Deep-Learning-Gemeinschaft weithin als robuste Alternative zu MNIST anerkannt. Er bietet einen komplexeren und vielfältigeren Satz von Bildern und ist daher eine ausgezeichnete Wahl für den Vergleich von Bildklassifizierungsmodellen. Die Struktur des Datensatzes mit 60.000 Trainingsbildern und 10.000 Testbildern, die jeweils mit einer von 10 Klassen gekennzeichnet sind, ist ideal, um die Leistung verschiedener Algorithmen für maschinelles Lernen in einem anspruchsvolleren Kontext zu bewerten.

Kann ich Ultralytics YOLO für Bildklassifizierungsaufgaben wie Fashion-MNIST verwenden?

Ja, Ultralytics YOLO Modelle können für Bildklassifizierungsaufgaben verwendet werden, auch für die des Fashion-MNIST-Datensatzes. YOLOv8 Die Software Fashion-MNIST unterstützt zum Beispiel verschiedene Bildverarbeitungsaufgaben wie Erkennung, Segmentierung und Klassifizierung. Um mit Bildklassifizierungsaufgaben zu beginnen, schau dir die Seite Klassifizierung an.

Was sind die wichtigsten Merkmale und die Struktur des Fashion-MNIST-Datensatzes?

Der Fashion-MNIST-Datensatz ist in zwei große Teilmengen unterteilt: 60.000 Trainingsbilder und 10.000 Testbilder. Jedes Bild ist ein 28x28 Pixel großes Graustufenbild, das eine von 10 modebezogenen Klassen repräsentiert. Aufgrund seiner Einfachheit und seines gut strukturierten Formats eignet sich der Datensatz ideal für das Training und die Bewertung von Modellen für maschinelles Lernen und Computer Vision Aufgaben. Weitere Einzelheiten zur Struktur des Datensatzes findest du im Abschnitt Struktur des Datensatzes.

Wie kann ich die Verwendung des Fashion-MNIST-Datensatzes in meiner Forschung anerkennen?

Wenn du den Fashion-MNIST-Datensatz in deinen Forschungs- oder Entwicklungsprojekten verwendest, ist es wichtig, ihn mit einem Link zum GitHub-Repository zu versehen. Dies hilft dabei, die Daten Zalando Research zuzuordnen, die den Datensatz für die öffentliche Nutzung zur Verfügung gestellt hat.



Erstellt am 2023-11-12, Aktualisiert am 2024-07-04
Autoren: glenn-jocher (5), RizwanMunawar (1)

Kommentare