No license

Link to this sectionCIFAR-10-Datensatz#

Das CIFAR-10 (Canadian Institute For Advanced Research) Dataset ist ein klassischer Benchmark für image classification mit 60.000 32x32 Farbbildern, die gleichmäßig auf 10 Klassen verteilt sind – Flugzeug, Auto, Vogel, Katze, Reh, Hund, Frosch, Pferd, Schiff und LKW. Es wird mit einer vordefinierten Aufteilung von 50.000 Trainings- und 10.000 Testbildern (6.000 pro Klasse) geliefert, was es zu einem leichtgewichtigen und ausgewogenen Ausgangspunkt für das Training und Benchmarking von Klassifizierungsmodellen macht. Für eine anspruchsvollere Herausforderung siehe das zugehörige CIFAR-100 Dataset.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionHauptfunktionen#

CIFAR-10 enthält 60.000 Farbbilder mit 32x32 Pixeln, die gleichmäßig in 10 Klassen unterteilt sind.
Jede Klasse enthält genau 6.000 Bilder – 5.000 für das Training und 1.000 für das Testen –, sodass das Dataset perfekt ausbalanciert ist.
Die 10 Klassen sind Flugzeug, Auto, Vogel, Katze, Reh, Hund, Frosch, Pferd, Schiff und LKW.
Das Dataset wird mit einer vordefinierten Train/Test-Aufteilung geliefert, sodass keine manuelle oder automatische Aufteilung erforderlich ist.
CIFAR-10 ist ein Standard-Benchmark für die Forschung im Bereich image classification und Objekterkennung.

Link to this sectionDatensatzstruktur#

CIFAR-10 wird mit einer offiziellen, vordefinierten Aufteilung geliefert, sodass keine automatische oder manuelle Partitionierung erforderlich ist:

Klassen: 10 (Flugzeug, Auto, Vogel, Katze, Reh, Hund, Frosch, Pferd, Schiff, LKW)
Gesamtanzahl der Bilder: 60.000 (32x32 Farbe)
Trainingsset: 50.000 Bilder (5.000 pro Klasse)
Testset: 10.000 Bilder (1.000 pro Klasse)

Validierungs-Split

CIFAR-10 hat keinen separaten Validierungsordner, daher verwendet Ultralytics standardmäßig das 10.000 Bilder umfassende Testset als Validierungs-Split während des Trainings.

Link to this sectionAnwendungen#

CIFAR-10 wird häufig verwendet, um image classification-Modelle zu trainieren und zu bewerten, von klassischen Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) bis hin zu modernen Deep-Learning-Architekturen. Die kleine Bildgröße und die ausgewogenen Klassen machen es ideal für schnelle Experimente, das Benchmarking neuer Algorithmen und das Lehren der Grundlagen der computer vision.

Link to this sectionVerwendung#

Trainiere ein YOLO Modell auf CIFAR-10 für 100 epochs bei einer Bildgröße von 32. Die vollständige Liste der verfügbaren Argumente findest du auf der Training-Seite und im Leitfaden für die Aufgabe image classification.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionBeispielbilder und Annotationen#

Das CIFAR-10 Dataset enthält Farbbilder verschiedener Objekte und bietet ein gut strukturiertes Dataset für image classification-Aufgaben. Hier sind einige Beispiele für Bilder aus dem Dataset:

CIFAR-10 Bildklassifizierungs-Datensatzbeispiele

Die Beispiele zeigen die Vielfalt der Objekte im CIFAR-10 Dataset und unterstreichen den Wert eines abwechslungsreichen Datasets für das Training robuster Bildklassifizierungsmodelle.

Link to this sectionZitate und Danksagungen#

Wenn du den CIFAR-10-Datensatz für deine Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafür danken, dass er das CIFAR-10 Dataset als wertvolle Ressource für die machine learning- und computer vision-Forschungsgemeinschaft erstellt und gepflegt hat. Weitere Informationen über das CIFAR-10 Dataset und seinen Ersteller findest du auf der CIFAR-10 Dataset-Website.

Link to this sectionFAQ#

Link to this sectionWofür wird das CIFAR-10 Dataset im maschinellen Lernen verwendet?#

Das CIFAR-10 Dataset wird häufig verwendet, um image classification- und Objekterkennungsmodelle zu trainieren und zu benchmarken. Es enthält 60.000 32x32 Farbbilder, die gleichmäßig auf 10 Klassen verteilt sind. Die geringe Größe und die ausgewogenen Klassen machen es zu einem schnellen, zuverlässigen Benchmark für Algorithmen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs).

Link to this sectionWie kann ich ein Ultralytics YOLO Modell auf dem CIFAR-10 Dataset trainieren?#

Um ein Ultralytics YOLO Modell auf CIFAR-10 zu trainieren, verwende die untenstehenden Code-Snippets. Das Dataset wird bei der ersten Verwendung automatisch heruntergeladen. Eine vollständige Liste der Argumente findest du auf der Modell-Training-Seite.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionWie viele Klassen hat das CIFAR-10 Dataset?#

CIFAR-10 hat 10 Klassen – Flugzeug, Auto, Vogel, Katze, Reh, Hund, Frosch, Pferd, Schiff und LKW – mit jeweils genau 6.000 Bildern, insgesamt also 60.000 Bilder. Die Klassen schließen sich gegenseitig aus und sind perfekt ausbalanciert, ohne Überschneidungen zwischen den Kategorien.

Link to this sectionWie wird das CIFAR-10 Dataset in Trainings- und Testsets unterteilt?#

CIFAR-10 wird mit einer vordefinierten Aufteilung von 50.000 Trainingsbildern und 10.000 Testbildern geliefert, mit jeweils genau 5.000 Trainings- und 1.000 Testbildern pro Klasse. Im Gegensatz zu ordnerbasierten Klassifizierungsdatasets, die Ultralytics automatisch aufteilt, wird die offizielle Partition von CIFAR-10 unverändert übernommen, und das Testset dient standardmäßig als Validierungs-Split während des Trainings.

Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle auf dem CIFAR-10 Dataset zu trainieren?#

Ja. Die Ultralytics Platform ermöglicht es dir, Datasets zu verwalten, image classification-Modelle zu trainieren und diese ohne umfangreiche Programmierung bereitzustellen. Dies ist eine bequeme Möglichkeit, CIFAR-10 Experimente in der Cloud durchzuführen, und du kannst weitere Optionen in unserer Übersicht der Klassifizierungsdatasets erkunden.

Mitwirkende

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Erstellt 12. Nov. 2023Aktualisiert vor 3 Tagen