Zum Inhalt springen

CIFAR-10-Datensatz

Der CIFAR-10-Datensatz (Canadian Institute For Advanced Research) ist eine Sammlung von Bildern, die häufig für maschinelles Lernen und Computer-Vision-Algorithmen verwendet wird. Er wurde von Forschern am CIFAR-Institut entwickelt und besteht aus 60.000 32x32-Farbbildern in 10 verschiedenen Klassen.



Pass auf: Wie trainiere ich ein Bildklassifizierungsmodell mit dem CIFAR-10-Datensatz mit Ultralytics YOLOv8

Hauptmerkmale

  • Der CIFAR-10-Datensatz besteht aus 60.000 Bildern, die in 10 Klassen unterteilt sind.
  • Jede Klasse enthält 6.000 Bilder, aufgeteilt in 5.000 zum Trainieren und 1.000 zum Testen.
  • Die Bilder sind farbig und haben eine Größe von 32x32 Pixeln.
  • Die 10 verschiedenen Klassen repräsentieren Flugzeuge, Autos, Vögel, Katzen, Hirsche, Hunde, Frösche, Pferde, Schiffe und Lastwagen.
  • CIFAR-10 wird häufig zum Trainieren und Testen im Bereich des maschinellen Lernens und der Computer Vision verwendet.

Struktur des Datensatzes

Der CIFAR-10-Datensatz ist in zwei Teilmengen aufgeteilt:

  1. Training Set: Diese Teilmenge enthält 50.000 Bilder, die für das Training von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Vergleichen der trainierten Modelle verwendet werden.

Anwendungen

Der CIFAR-10-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für Bildklassifizierungsaufgaben verwendet, z. B. von Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Algorithmen für maschinelles Lernen. Die Vielfalt des Datensatzes in Bezug auf die Klassen und das Vorhandensein von Farbbildern machen ihn zu einem vielseitigen Datensatz für die Forschung und Entwicklung im Bereich des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein YOLO Modell auf dem CIFAR-10-Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Beispielbilder und Anmerkungen

Der CIFAR-10-Datensatz enthält Farbbilder von verschiedenen Objekten und ist damit ein gut strukturierter Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im CIFAR-10-Datensatz und verdeutlicht, wie wichtig ein vielfältiger Datensatz für das Training robuster Bildklassifizierungsmodelle ist.

Zitate und Danksagungen

Wenn du den CIFAR-10-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafür danken, dass er den CIFAR-10-Datensatz als wertvolle Ressource für die Forschungsgemeinschaft im Bereich des maschinellen Lernens und des Computersehens erstellt und gepflegt hat. Weitere Informationen über den CIFAR-10-Datensatz und seinen Schöpfer findest du auf der Website des CIFAR-10-Datensatzes.

FAQ

Wie kann ich ein YOLO Modell mit dem CIFAR-10-Datensatz trainieren?

Um ein YOLO -Modell auf dem CIFAR-10-Datensatz mit Ultralytics zu trainieren, kannst du den Beispielen für Python und CLI folgen. Hier ist ein einfaches Beispiel, um dein Modell für 100 Epochen mit einer Bildgröße von 32x32 Pixeln zu trainieren:

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Weitere Informationen findest du auf der Seite zum Modell Training.

Was sind die wichtigsten Merkmale des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz besteht aus 60.000 Farbbildern, die in 10 Klassen unterteilt sind. Jede Klasse enthält 6.000 Bilder, davon 5.000 zum Trainieren und 1.000 zum Testen. Die Bilder sind 32x32 Pixel groß und unterscheiden sich in den folgenden Kategorien:

  • Flugzeuge
  • Autos
  • Vögel
  • Katzen
  • Hirsche
  • Hunde
  • Frösche
  • Pferde
  • Schiffe
  • Lastwagen

Dieser vielfältige Datensatz ist wichtig für das Training von Bildklassifizierungsmodellen in Bereichen wie maschinelles Lernen und Computer Vision. Weitere Informationen findest du in den CIFAR-10-Abschnitten zur Struktur des Datensatzes und zu den Anwendungen.

Warum sollte man den CIFAR-10-Datensatz für Bildklassifizierungsaufgaben verwenden?

Der CIFAR-10-Datensatz ist aufgrund seiner Vielfalt und Struktur ein ausgezeichneter Maßstab für die Bildklassifizierung. Er enthält eine ausgewogene Mischung aus 60.000 beschrifteten Bildern in 10 verschiedenen Kategorien, was das Training robuster und verallgemeinerter Modelle erleichtert. Er wird häufig zur Bewertung von Deep-Learning-Modellen, einschließlich Convolutional Neural Networks (CNNs) und anderen Algorithmen für maschinelles Lernen, verwendet. Der Datensatz ist relativ klein und eignet sich daher für schnelle Experimente und die Entwicklung von Algorithmen. Erkunde die zahlreichen Anwendungsmöglichkeiten im Abschnitt " Anwendungen ".

Wie ist der CIFAR-10-Datensatz aufgebaut?

Der CIFAR-10-Datensatz ist in zwei Hauptgruppen unterteilt:

  1. Trainingsset: Enthält 50.000 Bilder, die zum Trainieren von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Besteht aus 10.000 Bildern zum Testen und Vergleichen der trainierten Modelle.

Jeder Teilsatz umfasst Bilder, die in 10 Klassen eingeteilt sind und deren Anmerkungen für das Training und die Auswertung des Modells zur Verfügung stehen. Genauere Informationen findest du im Abschnitt über die Struktur der Datensätze.

Wie kann ich den CIFAR-10-Datensatz in meiner Forschung zitieren?

Wenn du den CIFAR-10-Datensatz in deinen Forschungs- oder Entwicklungsprojekten verwendest, stelle sicher, dass du das folgende Dokument zitierst:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Die Danksagung an die Ersteller des Datensatzes hilft, die weitere Forschung und Entwicklung in diesem Bereich zu unterstützen. Weitere Informationen findest du im Abschnitt Zitate und Danksagungen.

Welche praktischen Beispiele gibt es für die Nutzung des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz wird häufig für das Training von Bildklassifizierungsmodellen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) verwendet. Diese Modelle können bei verschiedenen Computer-Vision-Aufgaben eingesetzt werden, z. B. bei der Objekterkennung, der Bilderkennung und der automatischen Kennzeichnung. Einige praktische Beispiele findest du in den Codeschnipseln im Abschnitt " Verwendung".



Erstellt am 2023-11-12, Aktualisiert am 2024-07-12
Autoren: RizwanMunawar (1), glenn-jocher (6)

Kommentare