Zum Inhalt springen

CIFAR-10 Datensatz

Der CIFAR-10-Datensatz (Canadian Institute For Advanced Research) ist eine Sammlung von Bildern, die häufig für maschinelles Lernen und Computer-Vision-Algorithmen verwendet werden. Er wurde von Forschern des CIFAR-Instituts entwickelt und besteht aus 60.000 32x32-Farbbildern in 10 verschiedenen Klassen.



Ansehen: Wie man ein Bildklassifizierung Modell mit CIFAR-10-Datensatz unter Verwendung von Ultralytics YOLO11

Hauptmerkmale

  • Der CIFAR-10-Datensatz besteht aus 60.000 Bildern, die in 10 Klassen unterteilt sind.
  • Jede Klasse enthält 6.000 Bilder, aufgeteilt in 5.000 für das Training und 1.000 für das Testen.
  • Die Bilder sind farbig und haben eine Größe von 32x32 Pixeln.
  • Die 10 verschiedenen Klassen repräsentieren Flugzeuge, Autos, Vögel, Katzen, Hirsche, Hunde, Frösche, Pferde, Schiffe und Lastwagen.
  • CIFAR-10 wird häufig für das Training und Testen im Bereich Machine Learning und Computer Vision verwendet.

Dataset-Struktur

Der CIFAR-10-Datensatz ist in zwei Teilmengen unterteilt:

  1. Trainingssatz: Diese Untergruppe enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
  2. Testdatensatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.

Anwendungen

Der CIFAR-10-Datensatz wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen in Bildklassifizierungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen des maschinellen Lernens. Die Vielfalt des Datensatzes in Bezug auf Klassen und das Vorhandensein von Farbbildern machen ihn zu einem vielseitigen Datensatz für Forschung und Entwicklung im Bereich des maschinellen Lernens und der Computer Vision.

Nutzung

Um ein YOLO-Modell auf dem CIFAR-10-Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

sample_images und Anmerkungen

Der CIFAR-10-Datensatz enthält Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:

Beispielbild des Datensatzes

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Objekte im CIFAR-10-Dataset und unterstreicht die Bedeutung eines vielfältigen Datasets für das Training robuster Bildklassifizierungsmodelle.

Zitate und Danksagungen

Wenn Sie das CIFAR-10-Dataset in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Wir möchten Alex Krizhevsky für die Erstellung und Pflege des CIFAR-10 Datensatzes als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft danken. Weitere Informationen über den CIFAR-10 Datensatz und seinen Ersteller finden Sie auf der CIFAR-10 Datensatz-Website.

FAQ

Wie kann ich ein YOLO-Modell mit dem CIFAR-10-Datensatz trainieren?

Um ein YOLO-Modell auf dem CIFAR-10-Datensatz mit Ultralytics zu trainieren, können Sie die Beispiele für Python und CLI verwenden. Hier ist ein einfaches Beispiel, um Ihr Modell für 100 Epochen mit einer Bildgröße von 32x32 Pixel zu trainieren:

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Weitere Informationen finden Sie auf der Seite Training des Modells.

Was sind die wichtigsten Merkmale des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz besteht aus 60.000 Farbbildern, die in 10 Klassen unterteilt sind. Jede Klasse enthält 6.000 Bilder, davon 5.000 für das Training und 1.000 für das Testen. Die Bilder haben eine Größe von 32x32 Pixel und variieren in den folgenden Kategorien:

  • Flugzeuge
  • Autos
  • Vögel
  • Katzen
  • Hirsch
  • Hunde
  • Frösche
  • Pferde
  • Schiffe
  • LKWs

Dieser vielfältige Datensatz ist essenziell für das Training von Bildklassifizierungsmodellen in Bereichen wie maschinelles Lernen und Computer Vision. Für weitere Informationen besuchen Sie die CIFAR-10-Abschnitte über Datensatzstruktur und Anwendungen.

Warum sollte man den CIFAR-10-Datensatz für Bildklassifizierungsaufgaben verwenden?

Der CIFAR-10-Datensatz ist aufgrund seiner Vielfalt und Struktur ein ausgezeichneter Benchmark für die Bildklassifizierung. Er enthält eine ausgewogene Mischung aus 60.000 beschrifteten Bildern aus 10 verschiedenen Kategorien, was beim Training robuster und generalisierter Modelle hilft. Er wird häufig zur Bewertung von Deep-Learning-Modellen verwendet, einschließlich Convolutional Neural Networks (CNNs) und anderer Algorithmen für maschinelles Lernen. Der Datensatz ist relativ klein, wodurch er sich für schnelle Experimente und Algorithmusentwicklung eignet. Entdecken Sie seine zahlreichen Anwendungen im Abschnitt Anwendungen.

Wie ist der CIFAR-10-Datensatz strukturiert?

Der CIFAR-10-Datensatz ist in zwei Hauptuntergruppen unterteilt:

  1. Trainingsset: Enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
  2. Testmenge: Besteht aus 10.000 Bildern zum Testen und Benchmarking der trainierten Modelle.

Jede Teilmenge umfasst Bilder, die in 10 Klassen kategorisiert sind, wobei ihre Annotationen für das Modelltraining und die -bewertung leicht verfügbar sind. Weitere Informationen finden Sie im Abschnitt Dataset-Struktur.

Wie kann ich den CIFAR-10-Datensatz in meiner Forschung zitieren?

Wenn Sie den CIFAR-10-Datensatz in Ihren Forschungs- oder Entwicklungsprojekten verwenden, stellen Sie sicher, dass Sie das folgende Paper zitieren:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Die Anerkennung der Urheber des Datensatzes unterstützt die fortlaufende Forschung und Entwicklung in diesem Bereich. Weitere Informationen finden Sie im Abschnitt Zitate und Danksagungen.

Was sind einige praktische Beispiele für die Verwendung des CIFAR-10-Datensatzes?

Der CIFAR-10-Datensatz wird häufig für das Training von Bildklassifizierungsmodellen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) verwendet. Diese Modelle können in verschiedenen Computer-Vision-Aufgaben eingesetzt werden, darunter Objekterkennung, Bilderkennung und automatisierte Tagging. Praktische Beispiele finden Sie in den Code-Snippets im Abschnitt Verwendung.



📅 Vor 1 Jahr erstellt ✏️ Vor 5 Monaten aktualisiert

Kommentare