Zum Inhalt springen

CIFAR-100-Datensatz

Der CIFAR-100-Datensatz (Canadian Institute For Advanced Research) ist eine bedeutende Erweiterung des CIFAR-10-Datensatzes und besteht aus 60.000 32x32-Farbbildern in 100 verschiedenen Klassen. Er wurde von Forschern des CIFAR-Instituts entwickelt und bietet einen anspruchsvolleren Datensatz für komplexere Aufgaben im Bereich maschinelles Lernen und Computer Vision.

Hauptmerkmale

  • Der CIFAR-100-Datensatz besteht aus 60.000 Bildern, die in 100 Klassen unterteilt sind.
  • Jede Klasse enthält 600 Bilder, aufgeteilt in 500 zum Trainieren und 100 zum Testen.
  • Die Bilder sind farbig und haben eine Größe von 32x32 Pixeln.
  • Die 100 verschiedenen Klassen werden für die Klassifizierung auf höherer Ebene in 20 grobe Kategorien eingeteilt.
  • CIFAR-100 wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens und der Computer Vision verwendet.

Struktur des Datensatzes

Der CIFAR-100-Datensatz ist in zwei Teilmengen aufgeteilt:

  1. Training Set: Diese Teilmenge enthält 50.000 Bilder, die für das Training von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Vergleichen der trainierten Modelle verwendet werden.

Anwendungen

Der CIFAR-100-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, z. B. für Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere maschinelle Lernalgorithmen. Die Vielfalt des Datensatzes in Bezug auf die Klassen und das Vorhandensein von Farbbildern machen ihn zu einem anspruchsvollen und umfassenden Datensatz für die Forschung und Entwicklung auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein YOLO Modell auf dem CIFAR-100-Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar100', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Beispielbilder und Anmerkungen

Der CIFAR-100-Datensatz enthält Farbbilder von verschiedenen Objekten und ist damit ein gut strukturierter Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im CIFAR-100-Datensatz und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifizierungsmodelle ist.

Zitate und Danksagungen

Wenn du den CIFAR-100-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafür danken, dass er den CIFAR-100-Datensatz als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und des Computersehens erstellt und gepflegt hat. Weitere Informationen über den CIFAR-100-Datensatz und seinen Ersteller findest du auf der Website des CIFAR-100-Datensatzes.



Erstellt am 2023-11-12, Aktualisiert am 2023-11-22
Autoren: glenn-jocher (3)

Kommentare