No license

Link to this sectionMNIST-Datensatz#

Name: MNIST Bildklassifizierungs-Datensatz
Creator: Yann LeCun
Keywords: MNIST, Datensatz, handgeschriebene Ziffern, Bildklassifizierung, Deep Learning, Maschinelles Lernen, Trainingsset, Testset, NIST

Der MNIST (Modified National Institute of Standards and Technology) Datensatz ist ein Bildklassifizierungs-Benchmark, der aus 70.000 28x28 Graustufenbildern handgeschriebener Ziffern besteht und 10 Klassen umfasst – die Ziffern 0 bis 9. Er wird mit einer vordefinierten Aufteilung von 60.000 Trainings- und 10.000 Testbildern geliefert und dient seit langem als Standard-Benchmark für die Evaluierung von Machine Learning und Computer Vision Algorithmen. Für das schwierigere Äquivalent mit Kleidungsbildern siehe den verwandten Fashion-MNIST Datensatz; für Farbbilder siehe CIFAR-10.

Link to this sectionHauptfunktionen#

MNIST enthält 60.000 Trainingsbilder und 10.000 Testbilder von handgeschriebenen Ziffern, also insgesamt 70.000.
Jedes Bild ist ein 28x28 Graustufenbild einer einzelnen Ziffer, das normalisiert und per Anti-Aliasing in eine feste 28x28 BBox eingepasst wurde.
Die 10 Klassen umfassen die Ziffern 0–9, mit einer annähernd ausgeglichenen Anzahl an Bildern pro Klasse.
Er wird mit einer vordefinierten Trainings-/Test-Aufteilung geliefert, sodass keine manuelle oder automatische Unterteilung erforderlich ist.
MNIST ist ein Standard-Benchmark für die Bildklassifizierung und Forschung im Bereich Deep Learning.

Link to this sectionDatensatzstruktur#

MNIST wird mit einer offiziellen, vordefinierten Aufteilung geliefert, daher ist keine automatische oder manuelle Partitionierung nötig:

Klassen: 10 (handgeschriebene Ziffern 0–9)
Gesamtanzahl Bilder: 70.000 (28x28 Graustufen)
Trainingsset: 60.000 Bilder
Testset: 10.000 Bilder

Validierungs-Split

MNIST hat keinen separaten Validierungsordner, daher verwendet Ultralytics standardmäßig das 10.000-Bilder-Testset als Validierungssplit während des Trainings.

Jedes Bild ist mit der entsprechenden Ziffer (0–9) gelabelt, was MNIST zu einem überwachten (supervised) Datensatz macht, der ideal für Klassifizierungsaufgaben ist.

Link to this sectionAnwendungen#

MNIST wird häufig verwendet, um Bildklassifizierungs-Modelle zu trainieren und zu evaluieren, von klassischen Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) bis hin zu modernen Deep-Architekturen. Die kleinen Graustufenbilder und die 10 Ziffernklassen machen ihn zu einem schnellen, reproduzierbaren Benchmark für den Algorithmenvergleich und Experimente im Bereich Computer Vision.

Einige häufige Anwendungen sind:

Benchmarking neuer Klassifizierungsalgorithmen
Bildungszwecke zur Vermittlung von Machine-Learning-Konzepten
Prototyping von Bilderkennungssystemen
Testen von Modelloptimierungstechniken

Link to this sectionVerwendung#

Trainiere ein YOLO Klassifizierungsmodell auf MNIST für 100 Epochen bei einer Bildgröße von 28. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen und zwischengespeichert; wenn du die volle Kontrolle über das Preprocessing bevorzugst, sind die originalen gzip-Archive auch über die MNIST database verfügbar. Eine vollständige Liste der verfügbaren Argumente findest du auf der Training-Seite und im Leitfaden für die Aufgabe Bildklassifizierung.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Schnelltests mit MNIST160

Ultralytics stellt auch data="mnist160" bereit, ein 160-Bilder-Ausschnitt, der die ersten acht Bilder jeder Ziffer (0–9) sowohl aus den Trainings- als auch aus den Test-Splits enthält. Er spiegelt die MNIST-Verzeichnisstruktur wider, sodass du Datensätze austauschen kannst, ohne andere Argumente ändern zu müssen – ideal für CI-Pipelines oder Plausibilitätsprüfungen, bevor du dich auf den vollständigen 70.000-Bilder-Datensatz festlegst.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionBeispielbilder und Annotationen#

Beispielbilder aus dem MNIST Datensatz:

Beispiele des MNIST-Datensatzes zur Klassifizierung handgeschriebener Ziffern

Die Beispiele zeigen die Bandbreite an Handschriftstilen, die der Datensatz über die 10 Ziffernklassen hinweg erfasst.

Link to this sectionZitate und Danksagungen#

Wenn du den MNIST-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Wir möchten Yann LeCun, Corinna Cortes und Christopher J.C. Burges dafür danken, dass sie den MNIST Datensatz erstellt und als wertvolle Ressource für die Machine Learning und Computer Vision Forschungsgemeinschaft gepflegt haben. Weitere Informationen über den MNIST Datensatz und seine Ersteller findest du auf der MNIST dataset website.

Link to this sectionFAQ#

Link to this sectionWas ist der MNIST-Datensatz und warum ist er im Machine Learning wichtig?#

Der MNIST Datensatz ist ein Benchmark mit 70.000 28x28 Graustufenbildern von handgeschriebenen Ziffern, aufgeteilt in 60.000 Trainings- und 10.000 Testbilder über die 10 Klassen 0–9. Er ist die Standardreferenz für die Evaluierung von Bildklassifizierungs-Algorithmen – sein kleines, einheitliches Format ermöglicht es Forschern und Entwicklern, Methoden zu vergleichen und Fortschritte mit minimalem Einrichtungsaufwand nachzuvollziehen, weshalb er ein gängiger erster Benchmark im Machine Learning bleibt.

Link to this sectionWie viele Klassen und Bilder hat der MNIST Datensatz?#

MNIST hat 10 Klassen – die handgeschriebenen Ziffern 0 bis 9 – und insgesamt 70.000 Graustufenbilder, jedes 28x28 Pixel groß. Er wird mit einer vordefinierten Aufteilung von 60.000 Trainings- und 10.000 Testbildern geliefert, mit einer annähernd gleichen Anzahl an Beispielen pro Ziffer.

Link to this sectionWie kann ich Ultralytics YOLO verwenden, um ein Modell auf dem MNIST-Datensatz zu trainieren?#

Um ein Ultralytics YOLO Modell auf MNIST zu trainieren, verwende die untenstehenden Code-Schnipsel. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen. Eine detaillierte Liste der verfügbaren Trainingsargumente findest du auf der Training-Seite.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionWie ist der MNIST Datensatz in Trainings- und Testsets aufgeteilt?#

MNIST wird mit einer vordefinierten Aufteilung von 60.000 Trainingsbildern und 10.000 Testbildern geliefert. Im Gegensatz zu ordnerbasierten Klassifizierungsdatensätzen, die Ultralytics automatisch aufteilt, wird die offizielle Partitionierung von MNIST unverändert verwendet, und das Testset dient standardmäßig als Validierungssplit während des Trainings.

Link to this sectionWas ist der Unterschied zwischen den Datensätzen MNIST und EMNIST?#

Der MNIST Datensatz enthält nur handgeschriebene Ziffern, wohingegen der Extended MNIST (EMNIST) Datensatz sowohl Ziffern als auch Groß- und Kleinbuchstaben umfasst. EMNIST wurde als Nachfolger von MNIST entwickelt und verwendet das gleiche 28x28 Pixelformat, wodurch es mit Tools und Modellen kompatibel ist, die für den ursprünglichen MNIST Datensatz konzipiert wurden. Dieser breitere Bereich an Zeichen macht EMNIST für eine größere Vielfalt an Machine Learning Anwendungen nützlich.

Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle auf Datensätzen wie MNIST zu trainieren?#

Ja. Ultralytics Platform ermöglicht es dir, Datensätze hochzuladen, Bildklassifizierungs-Modelle zu trainieren und sie ohne umfangreiche Programmierung bereitzustellen. Es ist eine bequeme Methode, um MNIST Experimente in der Cloud auszuführen – siehe die Übersicht der Klassifizierungsdatensätze für verwandte Optionen.

Link to this sectionWie schneidet MNIST im Vergleich zu anderen Bildklassifizierungsdatensätzen ab?#

MNIST ist einfacher als viele moderne Datensätze wie CIFAR-10 oder ImageNet und daher ideal für Anfänger und schnelle Experimente. Während komplexere Datensätze größere Herausforderungen mit Farbbildern und vielfältigen Objektkategorien bieten, bleibt MNIST aufgrund seiner Einfachheit, kleinen Dateigröße und historischen Bedeutung bei der Entwicklung von Machine Learning Algorithmen wertvoll. Für einen schwierigeren direkten Ersatz mit derselben Struktur, siehe Fashion-MNIST, das Kleidungsstücke statt Ziffern enthält.

Mitwirkende

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Erstellt 12. Nov. 2023Aktualisiert gestern