Zum Inhalt springen

MNIST-Datensatz

Der MNIST-Datensatz (Modified National Institute of Standards and Technology) ist eine große Datenbank mit handgeschriebenen Ziffern, die häufig zum Training verschiedener Bildverarbeitungssysteme und maschineller Lernmodelle verwendet wird. Er wurde durch "Neuvermischung" der Stichproben aus den ursprünglichen NIST-Datensätzen erstellt und hat sich zu einem Maßstab für die Bewertung der Leistung von Bildklassifizierungsalgorithmen entwickelt.

Wesentliche Merkmale

  • MNIST enthält 60.000 Trainingsbilder und 10.000 Testbilder von handgeschriebenen Ziffern.
  • Der Datensatz umfasst Graustufenbilder der Größe 28x28 Pixel.
  • Die Bilder werden normalisiert, so dass sie in ein 28x28 Pixel großes Begrenzungsfeld passen, und mit Anti-Aliasing versehen, wobei Graustufen eingeführt werden.
  • MNIST wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Bildklassifizierungsaufgaben.

Struktur des Datensatzes

Der MNIST-Datensatz ist in zwei Teilmengen aufgeteilt:

  1. Trainingssatz: Dieser Teilsatz enthält 60.000 Bilder handgeschriebener Ziffern, die für das Training von Modellen für maschinelles Lernen verwendet werden.
  2. Testsatz: Dieser Teilsatz besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.

Erweiterte MNIST (EMNIST)

Extended MNIST (EMNIST) ist ein neuerer Datensatz, der vom NIST als Nachfolger von MNIST entwickelt und veröffentlicht wurde. Während MNIST nur Bilder von handgeschriebenen Ziffern enthielt, umfasst EMNIST alle Bilder der NIST Special Database 19, einer großen Datenbank mit handgeschriebenen Groß- und Kleinbuchstaben sowie Ziffern. Die Bilder in EMNIST wurden mit demselben Verfahren in das gleiche 28x28-Pixel-Format konvertiert wie die MNIST-Bilder. Dementsprechend werden Tools, die mit dem älteren, kleineren MNIST-Datensatz arbeiten, wahrscheinlich unverändert mit EMNIST funktionieren.

Anwendungen

Der MNIST-Datensatz wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, z. B. für Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Das einfache und gut strukturierte Format des Datensatzes macht ihn zu einer unverzichtbaren Ressource für Forscher und Praktiker auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein CNN-Modell auf dem MNIST-Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Beispielbilder und -kommentare

Der MNIST-Datensatz enthält Graustufenbilder von handgeschriebenen Ziffern und ist ein gut strukturierter Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele von Bildern aus dem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der handgeschriebenen Ziffern im MNIST-Datensatz und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifikationsmodelle ist.

Zitate und Danksagungen

Wenn Sie den MNIST-Datensatz in Ihrem

Forschungs- oder Entwicklungsarbeit, zitieren Sie bitte das folgende Papier:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Wir danken Yann LeCun, Corinna Cortes und Christopher J.C. Burges für die Erstellung und Pflege des MNIST-Datensatzes, der eine wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision darstellt. Weitere Informationen über den MNIST-Datensatz und seine Ersteller finden Sie auf der Website des MNIST-Datensatzes.

FAQ

Was ist der MNIST-Datensatz, und warum ist er für das maschinelle Lernen wichtig?

Der MNIST-Datensatz (Modified National Institute of Standards and Technology Dataset) ist eine weit verbreitete Sammlung handgeschriebener Ziffern, die zum Trainieren und Testen von Bildklassifizierungssystemen dient. Er umfasst 60.000 Trainingsbilder und 10.000 Testbilder, alle in Graustufen und mit einer Größe von 28x28 Pixeln. Die Bedeutung des Datensatzes liegt in seiner Rolle als Standard-Benchmark für die Bewertung von Bildklassifizierungsalgorithmen, der Forschern und Ingenieuren hilft, Methoden zu vergleichen und Fortschritte auf diesem Gebiet zu verfolgen.

Wie kann ich Ultralytics YOLO verwenden, um ein Modell für den MNIST-Datensatz zu trainieren?

Um ein Modell auf dem MNIST-Datensatz mit Ultralytics YOLO zu trainieren, können Sie die folgenden Schritte ausführen:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Eine detaillierte Liste der verfügbaren Schulungsargumente finden Sie auf der Seite Schulung.

Was ist der Unterschied zwischen den MNIST- und EMNIST-Datensätzen?

Der MNIST-Datensatz enthält nur handgeschriebene Ziffern, während der erweiterte MNIST-Datensatz (EMNIST) sowohl Ziffern als auch Groß- und Kleinbuchstaben enthält. EMNIST wurde als Nachfolger von MNIST entwickelt und verwendet dasselbe 28x28-Pixel-Format für die Bilder, wodurch es mit Tools und Modellen kompatibel ist, die für den ursprünglichen MNIST-Datensatz entwickelt wurden. Die größere Bandbreite an Zeichen in EMNIST macht sie für eine Vielzahl von Anwendungen des maschinellen Lernens nützlich.

Kann ich Ultralytics HUB verwenden, um Modelle auf benutzerdefinierten Datensätzen wie MNIST zu trainieren?

Ja, Sie können Ultralytics HUB verwenden, um Modelle auf benutzerdefinierten Datensätzen wie MNIST zu trainieren. Ultralytics HUB bietet eine benutzerfreundliche Schnittstelle für das Hochladen von Datensätzen, das Trainieren von Modellen und die Verwaltung von Projekten, ohne dass Sie umfangreiche Programmierkenntnisse benötigen. Weitere Einzelheiten zu den ersten Schritten finden Sie auf der Seite Ultralytics HUB Quickstart.

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 1 Monat

Kommentare