Caltech-256 Datensatz

Der Caltech-256 Datensatz ist eine umfangreiche Bildersammlung, die für Objektklassifizierungsaufgaben verwendet wird. Er enthält rund 30.000 Bilder, die in 257 Kategorien unterteilt sind (256 Objektkategorien und 1 Hintergrundkategorie). Die Bilder sind sorgfältig kuratiert und annotiert, um einen anspruchsvollen und vielfältigen Benchmark für Objekterkennungsalgorithmen zu bieten.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
Automatische Datenaufteilung

Der Caltech-256 Datensatz wird ohne vordefinierte Trainings-/Validierungs-Splits bereitgestellt. Wenn du jedoch die in den Anwendungsbeispielen unten gezeigten Trainingsbefehle verwendest, teilt das Ultralytics Framework den Datensatz automatisch für dich auf. Die Standardaufteilung beträgt 80 % für das Trainingsset und 20 % für das Validierungsset.

Hauptmerkmale

  • Der Caltech-256 Datensatz umfasst rund 30.000 Farbbilder, die in 257 Kategorien unterteilt sind.
  • Jede Kategorie enthält mindestens 80 Bilder.
  • Die Kategorien umfassen eine große Vielfalt an realen Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
  • Die Bilder haben unterschiedliche Größen und Auflösungen.
  • Caltech-256 wird häufig für Training und Tests im Bereich des maschinellen Lernens eingesetzt, insbesondere für Objekterkennungsaufgaben.

Datensatzstruktur

Wie bei Caltech-101 gibt es auch für den Caltech-256 Datensatz keine formale Trennung zwischen Trainings- und Testsets. Benutzer erstellen in der Regel ihre eigenen Splits entsprechend ihren spezifischen Anforderungen. Eine gängige Praxis ist die Verwendung einer zufälligen Teilmenge der Bilder für das Training und der verbleibenden Bilder für das Testen.

Anwendungen

Der Caltech-256 Datensatz wird intensiv für das Training und die Evaluierung von Deep Learning Modellen bei Objekterkennungsaufgaben verwendet, wie z. B. Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Algorithmen des maschinellen Lernens. Seine vielfältigen Kategorien und die hohe Bildqualität machen ihn zu einem wertvollen Datensatz für Forschung und Entwicklung in den Bereichen maschinelles Lernen und Computer Vision.

Verwendung

Um ein YOLO Modell für 100 Epochen auf dem Caltech-256 Datensatz zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Beispielbilder und Annotationen

Der Caltech-256 Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet so einen umfassenden Datensatz für Objekterkennungsaufgaben. Hier sind einige Beispiele von Bildern aus dem Datensatz (Quelle):

Caltech-256 Bildklassifizierungs-Datensatz Beispiele

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Objekte im Caltech-256 Datensatz und unterstreicht, wie wichtig ein abwechslungsreicher Datensatz für das Training robuster Objekterkennungsmodelle ist.

Zitate und Danksagungen

Wenn du den Caltech-256 Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Wir möchten Gregory Griffin, Alex Holub und Pietro Perona dafür danken, dass sie den Caltech-256 Datensatz als wertvolle Ressource für die Machine Learning und Computer Vision Forschungsgemeinschaft erstellt und gepflegt haben. Weitere Informationen über den Caltech-256 Datensatz und seine Ersteller findest du auf der Caltech-256 Datensatz-Website.

FAQ

Was ist der Caltech-256 Datensatz und warum ist er wichtig für maschinelles Lernen?

Der Caltech-256 Datensatz ist ein großer Bilddatensatz, der hauptsächlich für Objektklassifizierungsaufgaben im maschinellen Lernen und in der Computer Vision verwendet wird. Er besteht aus rund 30.000 Farbbildern, die in 257 Kategorien unterteilt sind und ein breites Spektrum an realen Objekten abdecken. Die vielfältigen und hochwertigen Bilder des Datensatzes machen ihn zu einem hervorragenden Benchmark für die Evaluierung von Objekterkennungsalgorithmen, was für die Entwicklung robuster Modelle des maschinellen Lernens entscheidend ist.

Wie kann ich mit Python oder CLI ein YOLO Modell auf dem Caltech-256 Datensatz trainieren?

Um ein YOLO Modell für 100 Epochen auf dem Caltech-256 Datensatz zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Weitere Optionen findest du auf der Seite zum Modell-Training.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Was sind die häufigsten Anwendungsfälle für den Caltech-256 Datensatz?

Der Caltech-256 Datensatz wird häufig für verschiedene Objekterkennungsaufgaben verwendet, wie z. B.:

  • Training von Convolutional Neural Networks (CNNs)
  • Evaluierung der Leistung von Support Vector Machines (SVMs)
  • Benchmarking neuer Deep Learning Algorithmen
  • Entwicklung von Object Detection Modellen unter Verwendung von Frameworks wie Ultralytics YOLO

Seine Vielfalt und umfassenden Annotationen machen ihn ideal für Forschung und Entwicklung im Bereich maschinelles Lernen und Computer Vision.

Wie ist der Caltech-256 Datensatz strukturiert und für Training und Test aufgeteilt?

Der Caltech-256 Datensatz wird nicht mit einer vordefinierten Aufteilung für Training und Test geliefert. Benutzer erstellen in der Regel ihre eigenen Splits entsprechend ihren spezifischen Anforderungen. Ein gängiger Ansatz besteht darin, eine zufällige Teilmenge von Bildern für das Training auszuwählen und die verbleibenden Bilder für den Test zu verwenden. Diese Flexibilität ermöglicht es den Benutzern, den Datensatz an ihre spezifischen Projektanforderungen und experimentellen Setups anzupassen.

Warum sollte ich Ultralytics YOLO für das Training von Modellen auf dem Caltech-256 Datensatz verwenden?

Ultralytics YOLO Modelle bieten mehrere Vorteile für das Training auf dem Caltech-256 Datensatz:

  • Hohe Genauigkeit: YOLO Modelle sind für ihre erstklassige Leistung bei Objekterkennungsaufgaben bekannt.
  • Geschwindigkeit: Sie bieten Echtzeit-Inferenz-Fähigkeiten und sind somit für Anwendungen geeignet, die schnelle Vorhersagen erfordern.
  • Benutzerfreundlichkeit: Mit der Ultralytics Platform können Benutzer Modelle trainieren, validieren und bereitstellen, ohne umfangreich programmieren zu müssen.
  • Vortrainierte Modelle: Der Start mit vortrainierten Modellen, wie yolo26n-cls.pt, kann die Trainingszeit erheblich verkürzen und die Genauigkeit des Modells verbessern.

Für weitere Details erkunde unseren umfassenden Trainingsleitfaden und erfahre mehr über Bildklassifizierung mit Ultralytics YOLO.

Kommentare