Zum Inhalt springen

MNIST

Der MNIST ist eine Datenbank mit Artikelbildern von Zalando, die aus einem Trainingssatz von 60.000 Beispielen und einem Testsatz von 10.000 Beispielen besteht. Jedes Beispiel ist ein 28x28-Graustufenbild, das mit einem Label aus 10 Klassen verknüpft ist. MNIST soll als direkter Ersatz für den ursprünglichen MNIST zum Benchmarking von Algorithmen für maschinelles Lernen dienen.



Ansehen: Wie geht das Bildklassifizierung auf Mode MNIST Datensatz mit Ultralytics YOLO11

Hauptmerkmale

  • MNIST enthält 60.000 Trainingsbilder und 10.000 Testbilder der Zalando-Artikelbilder.
  • Der Datensatz besteht aus Graustufenbildern der Größe 28x28 Pixel.
  • Jedes Pixel hat einen einzelnen Pixelwert, der die Helligkeit oder Dunkelheit dieses Pixels angibt, wobei höhere Zahlen dunkler bedeuten. Dieser Pixelwert ist eine ganze Zahl zwischen 0 und 255.
  • MNIST wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Bildklassifizierungsaufgaben.

Dataset-Struktur

Der MNIST ist in zwei Teilmengen aufgeteilt:

  1. Trainingssatz: Diese Teilmenge enthält 60.000 Bilder, die für das Training von Machine-Learning-Modellen verwendet werden.
  2. Testdatensatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.

Beschriftungen

Jedes Trainings- und Testbeispiel ist einer der folgenden Bezeichnungen zugeordnet:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Anwendungen

Der MNIST wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, z. B. für Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Das einfache und gut strukturierte Format des Datensatzes macht ihn zu einer unverzichtbaren Ressource für Forscher und Praktiker auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Nutzung

Um ein CNN-Modell auf dem MNIST für 100 Epochen mit einer Bildgröße von 28x28 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

sample_images und Anmerkungen

Der MNIST enthält Graustufenbilder von Zalando-Artikelbildern und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele von Bildern aus dem Datensatz:

Beispielbild des Datensatzes

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im MNIST und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifizierungsmodelle ist.

Danksagungen

Wenn Sie den MNIST in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, weisen Sie bitte auf den Datensatz hin, indem Sie auf das GitHub-Repository verlinken. Dieser Datensatz wurde von Zalando Research zur Verfügung gestellt.

FAQ

Was ist der MNIST und wie unterscheidet er sich von MNIST?

Der MNIST ist eine Sammlung von 70.000 Graustufenbildern der Zalando-Artikelbilder, die als moderner Ersatz für den ursprünglichen MNIST gedacht ist. Er dient als Benchmark für maschinelle Lernmodelle im Zusammenhang mit Bildklassifizierungsaufgaben. Im Gegensatz zu MNIST, das handgeschriebene Ziffern enthält, besteht MNIST aus 28x28-Pixel-Bildern, die in 10 modebezogene Klassen eingeteilt sind, z. B. T-Shirt/Top, Hose und Stiefelette.

Wie kann ich ein YOLO mit dem MNIST trainieren?

Um ein Ultralytics YOLO auf dem MNIST zu trainieren, können Sie sowohl Python als auch CLI verwenden. Hier ist ein kurzes Beispiel für den Anfang:

Trainingsbeispiel

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Weitere detaillierte Trainingsparameter finden Sie auf der Trainingsseite.

Warum sollte ich den MNIST für das Benchmarking meiner Machine-Learning-Modelle verwenden?

Der MNIST ist in der Deep-Learning-Community weithin als robuste Alternative zu MNIST anerkannt. Er bietet einen komplexeren und vielfältigeren Satz von Bildern, was ihn zu einer hervorragenden Wahl für das Benchmarking von Bildklassifizierungsmodellen macht. Die Struktur des Datensatzes, bestehend aus 60.000 Trainingsbildern und 10.000 Testbildern, die jeweils mit einer von 10 Klassen gekennzeichnet sind, macht ihn ideal für die Bewertung der Leistung verschiedener Algorithmen für maschinelles Lernen in einem anspruchsvolleren Kontext.

Kann ich Ultralytics YOLO für Bildklassifizierungsaufgaben wie MNIST verwenden?

Ja, dieYOLO Ultralytics können für Bildklassifizierungsaufgaben verwendet werden, auch für solche mit dem MNIST . YOLO11 zum Beispiel unterstützt verschiedene Bildverarbeitungsaufgaben wie Erkennung, Segmentierung und Klassifizierung. Um mit Bildklassifizierungsaufgaben zu beginnen, besuchen Sie die Seite Klassifizierung.

Was sind die wichtigsten Merkmale und die Struktur des MNIST ?

Der MNIST ist in zwei Hauptteilmengen unterteilt: 60.000 Trainingsbilder und 10.000 Testbilder. Jedes Bild ist ein 28x28 Pixel großes Graustufenbild, das eine von 10 Modeklassen repräsentiert. Aufgrund seiner Einfachheit und seines gut strukturierten Formats eignet sich der Datensatz ideal für das Training und die Bewertung von Modellen in den Bereichen maschinelles Lernen und Computer Vision. Weitere Einzelheiten über die Struktur des Datensatzes finden Sie im Abschnitt Struktur des Datensatzes.

Wie kann ich die Verwendung des MNIST in meiner Forschung anerkennen?

Wenn Sie den MNIST in Ihren Forschungs- oder Entwicklungsprojekten verwenden, ist es wichtig, ihn durch einen Link auf das GitHub-Repository zu erwähnen. Dies hilft dabei, die Daten Zalando Research zuzuordnen, die den Datensatz für die öffentliche Nutzung zur Verfügung gestellt haben.



📅 Erstellt vor 2 Jahren ✏️ Aktualisiert vor 11 Monaten
glenn-jocherRizwanMunawarUltralyticsAssistantMatthewNoycejk4e

Kommentare