Zum Inhalt springen

CIFAR-10-Datensatz

Der CIFAR-10-Datensatz (Canadian Institute For Advanced Research) ist eine Sammlung von Bildern, die hĂ€ufig fĂŒr maschinelles Lernen und Computer-Vision-Algorithmen verwendet wird. Er wurde von Forschern am CIFAR-Institut entwickelt und besteht aus 60.000 32x32-Farbbildern in 10 verschiedenen Klassen.



Pass auf: Wie trainiere ich ein Bildklassifizierungsmodell mit dem CIFAR-10-Datensatz mit Ultralytics YOLOv8

Hauptmerkmale

  • Der CIFAR-10-Datensatz besteht aus 60.000 Bildern, die in 10 Klassen unterteilt sind.
  • Jede Klasse enthĂ€lt 6.000 Bilder, aufgeteilt in 5.000 zum Trainieren und 1.000 zum Testen.
  • Die Bilder sind farbig und haben eine GrĂ¶ĂŸe von 32x32 Pixeln.
  • Die 10 verschiedenen Klassen reprĂ€sentieren Flugzeuge, Autos, Vögel, Katzen, Hirsche, Hunde, Frösche, Pferde, Schiffe und Lastwagen.
  • CIFAR-10 wird hĂ€ufig zum Trainieren und Testen im Bereich des maschinellen Lernens und der Computer Vision verwendet.

Struktur des Datensatzes

Der CIFAR-10-Datensatz ist in zwei Teilmengen aufgeteilt:

  1. Training Set: Diese Teilmenge enthĂ€lt 50.000 Bilder, die fĂŒr das Training von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Vergleichen der trainierten Modelle verwendet werden.

Anwendungen

Der CIFAR-10-Datensatz wird hĂ€ufig zum Trainieren und Evaluieren von Deep-Learning-Modellen fĂŒr Bildklassifizierungsaufgaben verwendet, z. B. von Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Algorithmen fĂŒr maschinelles Lernen. Die Vielfalt des Datensatzes in Bezug auf die Klassen und das Vorhandensein von Farbbildern machen ihn zu einem vielseitigen Datensatz fĂŒr die Forschung und Entwicklung im Bereich des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein YOLO Modell auf dem CIFAR-10-Datensatz fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 32x32 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Beispielbilder und Anmerkungen

Der CIFAR-10-Datensatz enthĂ€lt Farbbilder von verschiedenen Objekten und ist damit ein gut strukturierter Datensatz fĂŒr Bildklassifizierungsaufgaben. Hier sind einige Beispiele fĂŒr Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und KomplexitĂ€t der Objekte im CIFAR-10-Datensatz und verdeutlicht, wie wichtig ein vielfĂ€ltiger Datensatz fĂŒr das Training robuster Bildklassifizierungsmodelle ist.

Zitate und Danksagungen

Wenn du den CIFAR-10-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafĂŒr danken, dass er den CIFAR-10-Datensatz als wertvolle Ressource fĂŒr die Forschungsgemeinschaft im Bereich des maschinellen Lernens und des Computersehens erstellt und gepflegt hat. Weitere Informationen ĂŒber den CIFAR-10-Datensatz und seinen Schöpfer findest du auf der Website des CIFAR-10-Datensatzes.

FAQ

Wie kann ich ein YOLO Modell mit dem CIFAR-10-Datensatz trainieren?

Um ein YOLO -Modell auf dem CIFAR-10-Datensatz mit Ultralytics zu trainieren, kannst du den Beispielen fĂŒr Python und CLI folgen. Hier ist ein einfaches Beispiel, um dein Modell fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 32x32 Pixeln zu trainieren:

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Weitere Informationen findest du auf der Seite zum Modell Training.

Was sind die wichtigsten Merkmale des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz besteht aus 60.000 Farbbildern, die in 10 Klassen unterteilt sind. Jede Klasse enthĂ€lt 6.000 Bilder, davon 5.000 zum Trainieren und 1.000 zum Testen. Die Bilder sind 32x32 Pixel groß und unterscheiden sich in den folgenden Kategorien:

  • Flugzeuge
  • Autos
  • Vögel
  • Katzen
  • Hirsche
  • Hunde
  • Frösche
  • Pferde
  • Schiffe
  • Lastwagen

Dieser vielfĂ€ltige Datensatz ist wichtig fĂŒr das Training von Bildklassifizierungsmodellen in Bereichen wie maschinelles Lernen und Computer Vision. Weitere Informationen findest du in den CIFAR-10-Abschnitten zur Struktur des Datensatzes und zu den Anwendungen.

Warum sollte man den CIFAR-10-Datensatz fĂŒr Bildklassifizierungsaufgaben verwenden?

Der CIFAR-10-Datensatz ist aufgrund seiner Vielfalt und Struktur ein ausgezeichneter Maßstab fĂŒr die Bildklassifizierung. Er enthĂ€lt eine ausgewogene Mischung aus 60.000 beschrifteten Bildern in 10 verschiedenen Kategorien, was das Training robuster und verallgemeinerter Modelle erleichtert. Er wird hĂ€ufig zur Bewertung von Deep-Learning-Modellen, einschließlich Convolutional Neural Networks (CNNs) und anderen Algorithmen fĂŒr maschinelles Lernen, verwendet. Der Datensatz ist relativ klein und eignet sich daher fĂŒr schnelle Experimente und die Entwicklung von Algorithmen. Erkunde die zahlreichen Anwendungsmöglichkeiten im Abschnitt " Anwendungen ".

Wie ist der CIFAR-10-Datensatz aufgebaut?

Der CIFAR-10-Datensatz ist in zwei Hauptgruppen unterteilt:

  1. Trainingsset: EnthÀlt 50.000 Bilder, die zum Trainieren von Machine-Learning-Modellen verwendet werden.
  2. Testsatz: Besteht aus 10.000 Bildern zum Testen und Vergleichen der trainierten Modelle.

Jeder Teilsatz umfasst Bilder, die in 10 Klassen eingeteilt sind und deren Anmerkungen fĂŒr das Training und die Auswertung des Modells zur VerfĂŒgung stehen. Genauere Informationen findest du im Abschnitt ĂŒber die Struktur der DatensĂ€tze.

Wie kann ich den CIFAR-10-Datensatz in meiner Forschung zitieren?

Wenn du den CIFAR-10-Datensatz in deinen Forschungs- oder Entwicklungsprojekten verwendest, stelle sicher, dass du das folgende Dokument zitierst:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Die Danksagung an die Ersteller des Datensatzes hilft, die weitere Forschung und Entwicklung in diesem Bereich zu unterstĂŒtzen. Weitere Informationen findest du im Abschnitt Zitate und Danksagungen.

Welche praktischen Beispiele gibt es fĂŒr die Nutzung des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz wird hĂ€ufig fĂŒr das Training von Bildklassifizierungsmodellen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) verwendet. Diese Modelle können bei verschiedenen Computer-Vision-Aufgaben eingesetzt werden, z. B. bei der Objekterkennung, der Bilderkennung und der automatischen Kennzeichnung. Einige praktische Beispiele findest du in den Codeschnipseln im Abschnitt " Verwendung".



Erstellt am 2023-11-12, Aktualisiert am 2024-07-12
Autoren: RizwanMunawar (1), glenn-jocher (6)

Kommentare