Link to this sectionCaltech-256 Datensatz#

Der Caltech-256 Datensatz ist ein klassischer Benchmark für Bildklassifizierung mit 30.607 Bildern, die 256 Objektkategorien plus eine Hintergrundklasse umfassen. Jede Kategorie enthält mindestens 80 Bilder von realen Objekten – Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen – was ihn zu einem größeren und anspruchsvolleren Nachfolger von Caltech-101 für Objekterkennungsmodelle macht.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Automatische Datenaufteilung

Caltech-256 wird ohne vordefinierte Aufteilung in Training/Validierung geliefert. Die unten aufgeführten Trainingsbefehle führen automatisch eine Aufteilung von 80% Training / 20% Validierung durch, sodass keine manuelle Vorbereitung erforderlich ist.

Link to this sectionHauptfunktionen#

Caltech-256 enthält 30.607 Farbbilder in 256 Objektkategorien plus eine 257.clutter Hintergrundklasse (insgesamt 257 Klassenordner).
Die Kategorien umfassen eine Vielzahl von Objekten aus der realen Welt, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
Jede Kategorie enthält mindestens 80 Bilder, wobei die größte bis zu etwa 800 Bilder umfasst, weshalb die Klassengrößen unausgewogen sind.
Die Bilder haben unterschiedliche Größen und Auflösungen.
Caltech-256 wird häufig zum Benchmarking von Bildklassifizierungs- und Objekterkennungsalgorithmen verwendet.

Link to this sectionDatensatzstruktur#

Caltech-256 wird in 257 Ordnern vertrieben — einer pro Klasse, für 256 Objektkategorien plus eine 257.clutter Hintergrundklasse — ohne vordefinierte Aufteilung in Training/Validierung. Wenn du das Training startest, partitioniert Ultralytics die Bilder automatisch, damit die Modelle über alle 257 Klassen trainieren können, ganz ohne manuelles Setup:

Klassen: 257 (256 Objektkategorien + 1 Hintergrund)
Gesamtanzahl Bilder: 30.607
Aufteilung Training/Validierung: automatisch 80% / 20% (≈24.385 Training, ≈6.222 Validierung)
Bilder pro Klasse: mindestens 80 (unausgewogen, bis zu etwa 800)

Link to this sectionAnwendungen#

Der Caltech-256 Datensatz wird häufig verwendet, um Bildklassifizierungs- und Objekterkennungsmodelle zu trainieren und zu bewerten, einschließlich Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs). Seine große Anzahl an Kategorien und die hochwertigen Bilder machen ihn zu einem beliebten Benchmark für Machine Learning und Computer Vision Forschung sowie Prototyping.

Link to this sectionVerwendung#

Trainiere ein YOLO Modell auf Caltech-256 für 100 Epochen bei einer Bildgröße von 416. Die vollständige Liste der verfügbaren Argumente findest du auf der Training Seite und im Leitfaden zur Bildklassifizierung.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionBeispielbilder und Annotationen#

Der Caltech-256 Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungs-Aufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz (Quelle):

Beispiele des Caltech-256 Bildklassifizierungs-Datensatzes

Die Beispiele zeigen die Vielfalt und Komplexität der Objekte im Caltech-256 Datensatz und unterstreichen den Wert eines abwechslungsreichen Datensatzes für das Training robuster Objekterkennungsmodelle.

Link to this sectionZitate und Danksagungen#

Wenn du den Caltech-256 Datensatz für deine Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Wir möchten Gregory Griffin, Alex Holub und Pietro Perona dafür danken, dass sie den Caltech-256 Datensatz als wertvolle Ressource für die Machine Learning und Computer Vision Forschungsgemeinschaft erstellt und gepflegt haben. Weitere Informationen über den Caltech-256 Datensatz und seine Ersteller findest du auf der Caltech-256 Datensatz-Website.

Link to this sectionFAQ#

Link to this sectionWofür wird der Caltech-256 Datensatz im Machine Learning verwendet?#

Der Caltech-256 Datensatz wird häufig verwendet, um Bildklassifizierungs- und Objekterkennungsmodelle zu trainieren und zu bewerten. Er enthält 30.607 Bilder in 256 Objektkategorien plus eine Hintergrundklasse und stellt einen größeren und anspruchsvolleren Benchmark als Caltech-101 für Algorithmen wie Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) dar.

Link to this sectionWie kann ich ein Ultralytics YOLO Modell auf dem Caltech-256 Datensatz trainieren?#

Um ein Ultralytics YOLO Modell auf Caltech-256 zu trainieren, verwende die untenstehenden Code-Schnipsel. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen. Eine vollständige Liste der Argumente findest du auf der Modell-Training Seite.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionWie viele Klassen hat der Caltech-256 Datensatz?#

Caltech-256 enthält 256 Objektkategorien plus eine 257.clutter Hintergrundklasse, was insgesamt 257 Klassenordner und 30.607 Bilder ergibt. Wenn du mit Ultralytics trainierst, lernt das Modell alle 257 Klassen. Jede Kategorie enthält mindestens 80 Bilder, aber die Klassengrößen sind unausgewogen, wobei die größte bis zu etwa 800 Bilder umfasst.

Link to this sectionWie wird der Caltech-256 Datensatz in Trainings- und Validierungssets aufgeteilt?#

Caltech-256 hat keine vordefinierte Aufteilung. Wenn du zum ersten Mal trainierst, teilt Ultralytics ihn automatisch in 80% Training / 20% Validierung auf — etwa 24.385 Trainings- und 6.222 Validierungsbilder —, sodass du keine Aufteilungen manuell erstellen musst. Um die Aufteilung selbst zu steuern, organisiere die Bilder vor dem Training in train/ und val/ Ordnern.

Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle auf dem Caltech-256 Datensatz zu trainieren?#

Ja. Die Ultralytics Platform ermöglicht es dir, Datensätze zu verwalten, Bildklassifizierungs-Modelle zu trainieren und sie ohne umfangreiche Programmierung bereitzustellen. Es ist eine bequeme Möglichkeit, Caltech-256 Experimente in der Cloud durchzuführen, und du kannst weitere Optionen in unserer Übersicht der Klassifizierungsdatensätze erkunden.

Mitwirkende

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Erstellt 12. Nov. 2023Aktualisiert vor 3 Tagen