No license

Link to this sectionCIFAR-100 Datensatz#

Das CIFAR-100 (Canadian Institute For Advanced Research) Dataset ist ein Benchmark für Bildklassifizierung, bestehend aus 60.000 32x32 Farbbildern, die gleichmäßig auf 100 fein granulare Klassen (je 600 Bilder) verteilt sind, welche wiederum in 20 grobe Superklassen unterteilt sind. Es wurde von Alex Krizhevsky erstellt, wird mit einer vordefinierten Aufteilung von 50.000 Trainings- und 10.000 Testbildern ausgeliefert und ist damit das schwierigere, fein granularere Pendant zum CIFAR-10 Dataset.

Watch: How to Train an Image Classification Model on CIFAR-100 using Ultralytics YOLO

Link to this sectionHauptfunktionen#

CIFAR-100 enthält 60.000 Farbbilder mit 32x32 Pixeln, die gleichmäßig auf 100 Klassen aufgeteilt sind.
Jede Klasse umfasst genau 600 Bilder – 500 für das Training und 100 für das Testen –, wodurch das Dataset perfekt ausbalanciert ist.
Die 100 fein granularen Klassen sind für eine Klassifizierung auf höherer Ebene in 20 grobe Superklassen unterteilt.
Das Dataset wird mit einer vordefinierten Train/Test-Aufteilung geliefert, sodass keine manuelle oder automatische Aufteilung erforderlich ist.
CIFAR-100 ist ein Standard-Benchmark für die Forschung im Bereich der fein granularen Bildklassifizierung und Objekterkennung.

Link to this sectionDatensatzstruktur#

CIFAR-100 wird mit einer offiziellen, vordefinierten Aufteilung geliefert, sodass keine automatische oder manuelle Partitionierung erforderlich ist:

Klassen: 100 fein granulare Klassen, gruppiert in 20 grobe Superklassen
Gesamtanzahl der Bilder: 60.000 (32x32 Farbe)
Trainingsset: 50.000 Bilder (500 pro Klasse)
Testset: 10.000 Bilder (100 pro Klasse)

Validierungs-Split

CIFAR-100 besitzt keinen separaten Validierungsordner, daher verwendet Ultralytics standardmäßig das Testset mit 10.000 Bildern als Validierungs-Split während des Trainings. Das Training mit data="cifar100" trainiert die 100 fein granularen Klassen.

Link to this sectionAnwendungen#

CIFAR-100 wird häufig verwendet, um Modelle zur Bildklassifizierung zu trainieren und zu bewerten, von klassischen Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) bis hin zu modernen Deep-Learning-Architekturen. Die 100 fein granularen Klassen und die geringe Bildgröße machen es zu einem anspruchsvollen Benchmark für Machine Learning Forschung, Algorithmenvergleiche und Experimente im Bereich Computer Vision.

Link to this sectionVerwendung#

Trainiere ein YOLO Modell auf CIFAR-100 für 100 Epochen bei einer Bildgröße von 32. Für die vollständige Liste der verfügbaren Argumente siehe die Seite Training und den Leitfaden zur Bildklassifizierung.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionBeispielbilder und Annotationen#

Beispielbilder aus dem CIFAR-100 Dataset:

CIFAR-100 Bildklassifizierungs-Datensatz Beispiele

Die Beispiele zeigen die Vielfalt der Objekte im CIFAR-100 Dataset und unterstreichen den Wert eines abwechslungsreichen Datasets für das Training robuster Bildklassifizierungsmodelle.

Link to this sectionZitate und Danksagungen#

Wenn du den CIFAR-100 Datensatz in deiner Forschung oder Entwicklung verwendest, zitiere bitte das folgende Paper:

Zitat

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafür danken, dass er das CIFAR-100 Dataset erstellt und als wertvolle Ressource für die Machine Learning und Computer Vision Forschungsgemeinschaft gepflegt hat. Weitere Informationen über das CIFAR-100 Dataset und seinen Ersteller findest du auf der CIFAR-100 Dataset-Website.

Link to this sectionFAQ#

Link to this sectionWofür wird das CIFAR-100 Dataset im Bereich Machine Learning verwendet?#

Das CIFAR-100 Dataset wird häufig verwendet, um Modelle für fein granulare Bildklassifizierung und Objekterkennung zu trainieren und als Benchmark zu testen. Es enthält 60.000 32x32 Farbbilder in 100 Klassen, die in 20 Superklassen gruppiert sind, was es zu einem anspruchsvolleren Benchmark als CIFAR-10 für Algorithmen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) macht sowie für die Bewertung von Deep Learning Modellen, die mit Ultralytics YOLO erstellt wurden.

Link to this sectionWie kann ich ein Ultralytics YOLO Modell auf dem CIFAR-100 Dataset trainieren?#

Um ein Ultralytics YOLO Modell auf CIFAR-100 zu trainieren, verwende die untenstehenden Code-Snippets. Das Dataset wird bei der ersten Verwendung automatisch heruntergeladen. Eine vollständige Liste der Argumente findest du auf der Seite zum Modell Training.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionWie viele Klassen hat das CIFAR-100 Dataset?#

CIFAR-100 hat 100 fein granulare Klassen – wie Apfel, Delfin, Ahornbaum, Motorrad und Rakete – mit jeweils genau 600 Bildern, was insgesamt 60.000 Bilder ergibt. Diese 100 Klassen sind zusätzlich in 20 grobe Superklassen unterteilt (zum Beispiel deckt die Superklasse „Bäume“ Ahorn, Eiche, Palme, Kiefer und Weide ab). Das Training mit data="cifar100" verwendet die 100 fein granularen Klassen.

Link to this sectionWie ist das CIFAR-100 Dataset in Trainings- und Testsets aufgeteilt?#

CIFAR-100 wird mit einer vordefinierten Aufteilung von 50.000 Trainingsbildern und 10.000 Testbildern ausgeliefert, mit genau 500 Trainings- und 100 Testbildern pro Klasse. Im Gegensatz zu ordnerbasierten Klassifizierungs-Datasets, die Ultralytics automatisch aufteilt, wird die offizielle Partition von CIFAR-100 unverändert verwendet, wobei das Testset standardmäßig während des Trainings als Validierungs-Split dient.

Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle auf dem CIFAR-100 Dataset zu trainieren?#

Ja. Die Ultralytics Platform ermöglicht es dir, Datasets zu verwalten, Modelle zur Bildklassifizierung zu trainieren und diese ohne umfangreiche Programmierung bereitzustellen. Es ist eine bequeme Methode, CIFAR-100 Experimente in der Cloud auszuführen, und du kannst weitere Optionen in unserer Übersicht der Klassifizierungs-Datasets erkunden.

Mitwirkende

GLglenn-jocher¹⁵ RAraimbekovm² RIRizwanMunawar² MAMatthewNoyce¹ JKjk4e¹

Erstellt 12. Nov. 2023Aktualisiert vorgestern