CIFAR-10 Datensatz

Der CIFAR-10 (Canadian Institute For Advanced Research) Datensatz ist eine Sammlung von Bildern, die häufig für maschinelles Lernen und Computer-Vision-Algorithmen verwendet wird. Er wurde von Forschern des CIFAR-Instituts entwickelt und besteht aus 60.000 32x32 Farbbildern in 10 verschiedenen Klassen.



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

Hauptmerkmale

  • Der CIFAR-10 Datensatz besteht aus 60.000 Bildern, die in 10 Klassen unterteilt sind.
  • Jede Klasse enthält 6.000 Bilder, aufgeteilt in 5.000 für das Training und 1.000 für das Testen.
  • Die Bilder sind farbig und haben eine Größe von 32x32 Pixeln.
  • Die 10 verschiedenen Klassen repräsentieren Flugzeuge, Autos, Vögel, Katzen, Hirsche, Hunde, Frösche, Pferde, Schiffe und Lastwagen.
  • CIFAR-10 wird häufig für Training und Tests im Bereich des maschinellen Lernens und der Computer Vision eingesetzt.

Datensatzstruktur

Der CIFAR-10 Datensatz ist in zwei Teilmengen unterteilt:

  1. Trainingsdatensatz: Diese Teilmenge enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
  2. Testdatensatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Bewerten der trainierten Modelle verwendet werden.

Anwendungen

Der CIFAR-10 Datensatz wird häufig zum Trainieren und Evaluieren von Deep Learning Modellen bei Bildklassifizierungsaufgaben verwendet, wie etwa Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Algorithmen für maschinelles Lernen. Die Vielfalt des Datensatzes in Bezug auf Klassen und das Vorhandensein von Farbbildern machen ihn zu einem gut abgerundeten Datensatz für Forschung und Entwicklung im Bereich maschinelles Lernen und Computer Vision.

Verwendung

Um ein YOLO Modell auf dem CIFAR-10 Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Training Seite des Modells.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Beispielbilder und Annotationen

Der CIFAR-10 Datensatz enthält Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:

CIFAR-10 Bildklassifizierungsdatensatz Beispiele

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im CIFAR-10 Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Bildklassifizierungsmodelle.

Zitate und Danksagungen

Wenn du den CIFAR-10 Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

Zitat
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky dafür danken, dass er den CIFAR-10 Datensatz als wertvolle Ressource für die Forschungsgemeinschaft im Bereich maschinelles Lernen und Computer Vision erstellt und gepflegt hat. Weitere Informationen über den CIFAR-10 Datensatz und seinen Ersteller findest du auf der CIFAR-10 Datensatz-Website.

FAQ

Wie kann ich ein YOLO Modell auf dem CIFAR-10 Datensatz trainieren?

Um ein YOLO Modell auf dem CIFAR-10 Datensatz mit Ultralytics zu trainieren, kannst du den Beispielen für Python und CLI folgen. Hier ist ein grundlegendes Beispiel, um dein Modell für 100 Epochen mit einer Bildgröße von 32x32 Pixeln zu trainieren:

Beispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Weitere Details findest du auf der Training Seite des Modells.

Was sind die wichtigsten Merkmale des CIFAR-10 Datensatzes?

Der CIFAR-10 Datensatz besteht aus 60.000 Farbbildern, die in 10 Klassen unterteilt sind. Jede Klasse enthält 6.000 Bilder, davon 5.000 für das Training und 1.000 für das Testen. Die Bilder sind 32x32 Pixel groß und variieren über die folgenden Kategorien:

  • Flugzeuge
  • Autos
  • Vögel
  • Katzen
  • Hirsche
  • Hunde
  • Frösche
  • Pferde
  • Schiffe
  • Lastwagen

Dieser vielfältige Datensatz ist essenziell für das Training von Bildklassifizierungsmodellen in Bereichen wie maschinellem Lernen und Computer Vision. Weitere Informationen findest du in den Abschnitten zu Datensatzstruktur und Anwendungen von CIFAR-10.

Warum den CIFAR-10 Datensatz für Bildklassifizierungsaufgaben verwenden?

Der CIFAR-10 Datensatz ist aufgrund seiner Vielfalt und Struktur ein hervorragender Maßstab für die Bildklassifizierung. Er enthält eine ausgewogene Mischung aus 60.000 beschrifteten Bildern in 10 verschiedenen Kategorien, was beim Training robuster und verallgemeinerter Modelle hilft. Er wird häufig zur Evaluierung von Deep-Learning-Modellen verwendet, einschließlich Convolutional Neural Networks (CNNs) und anderen Algorithmen für maschinelles Lernen. Der Datensatz ist relativ klein, was ihn für schnelle Experimente und Algorithmenentwicklung geeignet macht. Entdecke seine zahlreichen Anwendungen im Abschnitt Anwendungen.

Wie ist der CIFAR-10 Datensatz strukturiert?

Der CIFAR-10 Datensatz ist in zwei Hauptteilmengen strukturiert:

  1. Trainingsdatensatz: Enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
  2. Testdatensatz: Besteht aus 10.000 Bildern zum Testen und Bewerten der trainierten Modelle.

Jede Teilmenge umfasst Bilder, die in 10 Klassen kategorisiert sind, deren Annotationen für das Modelltraining und die Evaluierung leicht verfügbar sind. Weitere detaillierte Informationen findest du im Abschnitt Datensatzstruktur.

Wie kann ich den CIFAR-10 Datensatz in meiner Forschung zitieren?

Wenn du den CIFAR-10 Datensatz in deinen Forschungs- oder Entwicklungsprojekten verwendest, stelle sicher, dass du das folgende Papier zitierst:

Zitat
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Die Anerkennung der Ersteller des Datensatzes hilft dabei, die fortlaufende Forschung und Entwicklung in diesem Bereich zu unterstützen. Weitere Details findest du im Abschnitt Zitate und Danksagungen.

Was sind einige praktische Beispiele für die Verwendung des CIFAR-10 Datensatzes?

Der CIFAR-10 Datensatz wird häufig zum Trainieren von Bildklassifizierungsmodellen verwendet, wie etwa Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs). Diese Modelle können bei verschiedenen Computer-Vision-Aufgaben eingesetzt werden, einschließlich Objekterkennung, Bilderkennung und automatisierter Tagging-Prozesse. Um einige praktische Beispiele zu sehen, schaue dir die Code-Snippets im Abschnitt Nutzung an.

Kommentare