Zum Inhalt springen

MNIST

Die Website MNIST (Modified National Institute of Standards and Technology) ist eine große Datenbank mit handgeschriebenen Ziffern, die häufig für das Training verschiedener Bildverarbeitungssysteme und maschineller Lernmodelle verwendet wird. Er wurde durch "Neuvermischung" der Stichproben aus den ursprünglichen NIST-Datensätzen erstellt und hat sich zu einem Maßstab für die Bewertung der Leistung von Bildklassifizierungsalgorithmen entwickelt.

Hauptmerkmale

  • MNIST enthält 60.000 Trainingsbilder und 10.000 Testbilder von handgeschriebenen Ziffern.
  • Der Datensatz umfasst Graustufenbilder der Größe 28×28 Pixel.
  • Die Bilder werden normalisiert, um in einen 28×28-Pixel-Bounding Box zu passen, und Anti-Aliasing wird angewendet, wodurch Graustufen eingeführt werden.
  • MNIST wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Bildklassifizierungsaufgaben.

Dataset-Struktur

Der MNIST ist in zwei Teilmengen aufgeteilt:

  1. Trainingsdatensatz: Diese Teilmenge enthält 60.000 Bilder von handgeschriebenen Ziffern, die zum Trainieren von Modellen des maschinellen Lernens verwendet werden.
  2. Testdatensatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.

Zugang zu den Datensätzen

  • Originaldateien: Laden Sie die gzip-Archive von der MNIST von Yann LeCun herunter, wenn Sie die Vorverarbeitung direkt kontrollieren wollen.
  • Ultralytics: Verwenden Sie data="mnist" (oder data="mnist160" für die Untergruppe unten) in Ihrem Befehl, und der Datensatz wird heruntergeladen, in PNG konvertiert und automatisch zwischengespeichert.

Jedes Bild im Datensatz ist mit der entsprechenden Ziffer (0-9) beschriftet, was es zu einem überwachten Lerndatensatz macht, der ideal für Klassifizierungsaufgaben ist.

Erweiterte MNIST (EMNIST)

Extended MNIST (EMNIST) ist ein neuerer Datensatz, der vom NIST als Nachfolger von MNIST entwickelt und veröffentlicht wurde. Während MNIST nur Bilder von handgeschriebenen Ziffern enthielt, umfasst EMNIST alle Bilder der NIST Special Database 19, einer großen Datenbank mit handgeschriebenen Groß- und Kleinbuchstaben sowie Ziffern. Die Bilder in EMNIST wurden nach demselben Verfahren in das gleiche 28×28-Pixel-Format konvertiert wie die MNIST . Dementsprechend werden Tools, die mit dem älteren, kleineren MNIST arbeiten, wahrscheinlich unverändert mit EMNIST funktionieren.

Anwendungen

Der MNIST wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, z. B. für Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen für maschinelles Lernen. Das einfache und gut strukturierte Format des Datensatzes macht ihn zu einer unverzichtbaren Ressource für Forscher und Praktiker auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Einige gängige Anwendungen sind:

  • Benchmarking neuer Klassifizierungsalgorithmen
  • Bildungszwecke zum Lehren von Konzepten des maschinellen Lernens
  • Prototyping von Bilderkennungssystemen
  • Testen von Modelloptimierungstechniken

Nutzung

Um ein CNN-Modell auf dem MNIST für 100 Epochen mit einer Bildgröße von 28×28 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

sample_images und Anmerkungen

Der MNIST enthält Graustufenbilder von handgeschriebenen Ziffern und ist ein gut strukturierter Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele von Bildern aus dem Datensatz:

Beispielbild des Datensatzes

Das Beispiel zeigt die Vielfalt und Komplexität der handgeschriebenen Ziffern im MNIST und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifikationsmodelle ist.

Zitate und Danksagungen

Wenn Sie den MNIST in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Wir möchten Yann LeCun, Corinna Cortes und Christopher J.C. Burges für die Erstellung und Pflege des MNIST als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision danken. Weitere Informationen über den MNIST und seine Ersteller finden Sie auf der Website desMNIST .

MNIST160-Schnelltests

Brauchen Sie einen blitzschnellen Regressionstest? Ultralytics stellt auch Folgendes zur Verfügung data="mnist160", ein 160-Bild-Slice, das die ersten acht Beispiele aus jeder Ziffernklasse enthält. Es spiegelt die MNIST-Verzeichnisstruktur wider, sodass Sie Datensätze austauschen können, ohne andere Argumente zu ändern:

Beispiel mit MNIST160 trainieren

yolo classify train data=mnist160 model=yolo11n-cls.pt epochs=5 imgsz=28

Verwenden Sie diese Teilmenge für CI-Pipelines oder für Sicherheitsprüfungen, bevor Sie den gesamten 70.000-Bilder-Datensatz übernehmen.

FAQ

Was ist der MNIST , und warum ist er für das maschinelle Lernen wichtig?

Die Website MNIST Datensatz (Modified National Institute of Standards and Technology Dataset) ist eine weit verbreitete Sammlung handgeschriebener Ziffern, die zum Trainieren und Testen von Bildklassifizierungssystemen dient. Er umfasst 60.000 Trainingsbilder und 10.000 Testbilder, die alle Graustufen und eine Größe von 28×28 Pixeln haben. Die Bedeutung des Datensatzes liegt in seiner Rolle als Standard-Benchmark für die Bewertung von Bildklassifizierungsalgorithmen, der Forschern und Ingenieuren hilft, Methoden zu vergleichen und Fortschritte auf diesem Gebiet track .

Wie kann ich Ultralytics YOLO verwenden, um ein Modell auf dem MNIST zu trainieren?

Um ein Modell auf dem MNIST mit Ultralytics YOLO zu trainieren, können Sie die folgenden Schritte ausführen:

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Eine detaillierte Liste der verfügbaren Trainingsargumente finden Sie auf der Seite Training.

Was ist der Unterschied zwischen den MNIST und EMNIST-Datensätzen?

Der MNIST enthält nur handgeschriebene Ziffern, während der erweiterte MNIST (EMNIST) sowohl Ziffern als auch Groß- und Kleinbuchstaben enthält. EMNIST wurde als Nachfolger von MNIST entwickelt und verwendet dasselbe 28×28-Pixel-Format für die Bilder, wodurch es mit Tools und Modellen kompatibel ist, die für den ursprünglichen MNIST entwickelt wurden. Die größere Bandbreite an Zeichen in EMNIST macht sie für eine Vielzahl von Anwendungen des maschinellen Lernens nützlich.

Kann ich Ultralytics HUB verwenden, um Modelle auf benutzerdefinierten Datensätzen wie MNIST zu trainieren?

Ja, Sie können Ultralytics HUB verwenden, um Modelle auf benutzerdefinierten Datensätzen wie MNIST zu trainieren. Ultralytics HUB bietet eine benutzerfreundliche Schnittstelle zum Hochladen von Datensätzen, zum Trainieren von Modellen und zum Verwalten von Projekten, ohne dass umfangreiche Programmierkenntnisse erforderlich sind. Weitere Einzelheiten über die ersten Schritte finden Sie auf der Ultralytics HUB Quickstart-Seite.

Wie schneidet MNIST im Vergleich zu anderen Bildklassifizierungsdatensätzen ab?

MNIST ist einfacher als viele moderne Datensätze wie CIFAR-10 oder ImageNetund ist daher ideal für Anfänger und schnelle Experimente. Während komplexere Datensätze mit Farbbildern und verschiedenen Objektkategorien größere Herausforderungen bieten, bleibt MNIST aufgrund seiner Einfachheit, geringen Dateigröße und historischen Bedeutung für die Entwicklung von Algorithmen für maschinelles Lernen wertvoll. Für fortgeschrittenere Klassifizierungsaufgaben empfiehlt sich MNIST, das die gleiche Struktur aufweist, aber Kleidungsstücke statt Ziffern enthält.



📅 Vor 2 Jahren erstellt ✏️ Vor 25 Tagen aktualisiert
glenn-jocherpderrengerUltralyticsAssistantMatthewNoycejk4e

Kommentare