CIFAR-100-Datensatz
Der CIFAR-100-Datensatz (Canadian Institute For Advanced Research) ist eine bedeutende Erweiterung des CIFAR-10-Datensatzes und besteht aus 60.000 32x32-Farbbildern in 100 verschiedenen Klassen. Er wurde von Forschern des CIFAR-Instituts entwickelt und bietet einen anspruchsvolleren Datensatz für komplexere Aufgaben des maschinellen Lernens und der Computer Vision.
Ansehen: So trainieren Sie Ultralytics YOLO11 auf CIFAR-100 | Schritt-für-Schritt-Anleitung zur Bildklassifizierung 🚀
Hauptmerkmale
- Der CIFAR-100-Datensatz besteht aus 60.000 Bildern, die in 100 Klassen unterteilt sind.
- Jede Klasse enthält 600 Bilder, aufgeteilt in 500 für das Training und 100 für das Testen.
- Die Bilder sind farbig und haben eine Größe von 32x32 Pixeln.
- Die 100 verschiedenen Klassen sind in 20 grobe Kategorien für eine Klassifizierung auf höherer Ebene gruppiert.
- CIFAR-100 wird häufig für das Training und Testen im Bereich des maschinellen Lernens und der Computer Vision verwendet.
Dataset-Struktur
Der CIFAR-100-Datensatz ist in zwei Teilmengen unterteilt:
- Trainingssatz: Diese Untergruppe enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
- Testdatensatz: Diese Teilmenge besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.
Anwendungen
Der CIFAR-100-Datensatz wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen in Bildklassifizierungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen des maschinellen Lernens. Die Vielfalt des Datensatzes in Bezug auf Klassen und das Vorhandensein von Farbbildern machen ihn zu einem anspruchsvolleren und umfassenderen Datensatz für Forschung und Entwicklung im Bereich des maschinellen Lernens und der Computer Vision.
Nutzung
Um ein YOLO-Modell auf dem CIFAR-100-Datensatz für 100 Epochen mit einer Bildgröße von 32x32 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Training des Modells.
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
sample_images und Anmerkungen
Der CIFAR-100-Datensatz enthält Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:
Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im CIFAR-100-Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Bildklassifizierungsmodelle.
Zitate und Danksagungen
Wenn Sie den CIFAR-100-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Wir möchten Alex Krizhevsky dafür anerkennen, dass er den CIFAR-100-Datensatz als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft erstellt und pflegt. Weitere Informationen über den CIFAR-100-Datensatz und seinen Urheber finden Sie auf der CIFAR-100-Datensatz-Website.
FAQ
Was ist der CIFAR-100-Datensatz und warum ist er von Bedeutung?
Der CIFAR-100 Datensatz ist eine große Sammlung von 60.000 32x32 Farbbildern, die in 100 Klassen eingeteilt sind. Er wurde vom Canadian Institute For Advanced Research (CIFAR) entwickelt und bietet einen anspruchsvollen Datensatz, der sich ideal für komplexe Aufgaben des maschinellen Lernens und der Computer Vision eignet. Seine Bedeutung liegt in der Vielfalt der Klassen und der geringen Größe der Bilder, was ihn zu einer wertvollen Ressource für das Training und Testen von Deep-Learning-Modellen wie Convolutional Neural Networks (CNNs) mit Frameworks wie Ultralytics YOLO macht.
Wie trainiere ich ein YOLO-Modell auf dem CIFAR-100-Datensatz?
Sie können ein YOLO-Modell auf dem CIFAR-100-Datensatz entweder mit Python- oder CLI-Befehlen trainieren. So geht's:
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Training des Modells.
Was sind die Hauptanwendungen des CIFAR-100-Datensatzes?
Der CIFAR-100-Datensatz wird häufig zum Trainieren und Evaluieren von Deep-Learning-Modellen für die Bildklassifizierung verwendet. Sein vielfältiges Set von 100 Klassen, gruppiert in 20 grobe Kategorien, bietet eine anspruchsvolle Umgebung zum Testen von Algorithmen wie Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Ansätzen des maschinellen Lernens. Dieser Datensatz ist eine wichtige Ressource in der Forschung und Entwicklung in den Bereichen maschinelles Lernen und Computer Vision, insbesondere für die Objekterkennung und Klassifizierungsaufgaben.
Wie ist der CIFAR-100-Datensatz aufgebaut?
Der CIFAR-100-Datensatz ist in zwei Hauptteilmengen unterteilt:
- Trainingsset: Enthält 50.000 Bilder, die zum Trainieren von Modellen für maschinelles Lernen verwendet werden.
- Testset: Besteht aus 10.000 Bildern, die zum Testen und Benchmarking der trainierten Modelle verwendet werden.
Jede der 100 Klassen enthält 600 Bilder, davon 500 Bilder für das Training und 100 für das Testen, wodurch sie sich in einzigartiger Weise für rigorose akademische und industrielle Forschung eignet.
Wo finde ich sample_images und Annotationen aus dem CIFAR-100-Datensatz?
Der CIFAR-100-Datensatz enthält eine Vielzahl von Farbbildern verschiedener Objekte, was ihn zu einem strukturierten Datensatz für Bildklassifizierungsaufgaben macht. Auf der Dokumentationsseite finden Sie sample_images und Anmerkungen. Diese Beispiele verdeutlichen die Vielfalt und Komplexität des Datensatzes, die für das Training robuster Bildklassifizierungsmodelle wichtig sind. Weitere Datensätze, die für Klassifizierungsaufgaben geeignet sind, finden Sie in der Ultralytics-Übersicht über Klassifizierungsdatensätze.