Caltech-101-Datensatz
Der Caltech-101-Datensatz ist ein weit verbreiteter Datensatz für Objekterkennungsaufgaben und enthält etwa 9.000 Bilder aus 101 Objektkategorien. Die Kategorien wurden so gewählt, dass sie eine Vielzahl von Objekten aus der realen Welt widerspiegeln, und die Bilder selbst wurden sorgfältig ausgewählt und annotiert, um einen anspruchsvollen Benchmark für Objekterkennungsalgorithmen zu bieten.
Der Caltech-101-Datensatz wird in der vorliegenden Form ohne vordefinierte Trainings-/Validierungs-Splits geliefert. Wenn du jedoch die in den unten stehenden Nutzungsbeispielen bereitgestellten Trainingsbefehle verwendest, teilt das Ultralytics-Framework den Datensatz automatisch für dich auf. Die Standardaufteilung beträgt 80 % für das Trainingsset und 20 % für das Validierungsset.
Hauptmerkmale
- Der Caltech-101-Datensatz umfasst rund 9.000 Farbbilder, die in 101 Kategorien unterteilt sind.
- Die Kategorien umfassen eine große Vielfalt an Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
- Die Anzahl der Bilder pro Kategorie variiert und liegt zwischen etwa 40 und 800 Bildern.
- Die Bilder haben unterschiedliche Größen, wobei die meisten eine mittlere Auflösung aufweisen.
- Caltech-101 wird häufig für das Training und Testen im Bereich des maschinellen Lernens verwendet, insbesondere für Objekterkennungsaufgaben.
Datensatzstruktur
Im Gegensatz zu vielen anderen Datensätzen ist der Caltech-101-Datensatz nicht formal in Trainings- und Testsets unterteilt. Benutzer erstellen normalerweise ihre eigenen Splits basierend auf ihren spezifischen Anforderungen. Eine gängige Praxis ist es jedoch, eine zufällige Teilmenge von Bildern für das Training zu verwenden (z. B. 30 Bilder pro Kategorie) und die verbleibenden Bilder für den Test.
Anwendungen
Der Caltech-101-Datensatz wird intensiv für das Training und die Evaluierung von Deep Learning-Modellen für Objekterkennungsaufgaben wie Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere Algorithmen des maschinellen Lernens genutzt. Seine große Vielfalt an Kategorien und die hochwertigen Bilder machen ihn zu einem hervorragenden Datensatz für Forschung und Entwicklung im Bereich Machine Learning und Computer Vision.
Verwendung
Um ein YOLO-Modell auf dem Caltech-101-Datensatz für 100 Epochen zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Training für Modelle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Beispielbilder und Annotationen
Der Caltech-101-Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Aufgaben der Bildklassifizierung. Hier sind einige Beispiele für Bilder aus dem Datensatz:

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Objekte im Caltech-101-Datensatz und unterstreicht die Bedeutung eines diversen Datensatzes für das Training robuster Objekterkennungsmodelle.
Zitate und Danksagungen
Wenn du den Caltech-101-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Wir möchten Li Fei-Fei, Rob Fergus und Pietro Perona dafür danken, dass sie den Caltech-101-Datensatz als wertvolle Ressource für die Forschungsgemeinschaft im Bereich maschinelles Lernen und Computer Vision erstellt und gepflegt haben. Weitere Informationen zum Caltech-101-Datensatz und seinen Erstellern findest du auf der Caltech-101-Datensatz-Website.
FAQ
Wofür wird der Caltech-101-Datensatz beim maschinellen Lernen verwendet?
Der Caltech-101-Datensatz wird im maschinellen Lernen häufig für Objekterkennungsaufgaben eingesetzt. Er enthält etwa 9.000 Bilder in 101 Kategorien und bietet einen anspruchsvollen Benchmark zur Evaluierung von Objekterkennungsalgorithmen. Forscher nutzen ihn zum Trainieren und Testen von Modellen, insbesondere Neuronale Netze (CNNs) und Support Vector Machines (SVMs), im Bereich Computer Vision.
Wie kann ich ein Ultralytics YOLO-Modell auf dem Caltech-101-Datensatz trainieren?
Um ein Ultralytics YOLO-Modell auf dem Caltech-101-Datensatz zu trainieren, kannst du die bereitgestellten Code-Snippets verwenden. Zum Beispiel, um für 100 Epochen zu trainieren:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Für detailliertere Argumente und Optionen siehe die Seite Training für Modelle.
Was sind die Hauptmerkmale des Caltech-101-Datensatzes?
Der Caltech-101-Datensatz beinhaltet:
- Etwa 9.000 Farbbilder in 101 Kategorien.
- Kategorien, die eine vielfältige Palette von Objekten abdecken, einschließlich Tieren, Fahrzeugen und Haushaltsgegenständen.
- Variable Anzahl von Bildern pro Kategorie, typischerweise zwischen 40 und 800.
- Unterschiedliche Bildgrößen, wobei die meisten eine mittlere Auflösung haben.
Diese Merkmale machen ihn zu einer exzellenten Wahl für das Training und die Evaluierung von Objekterkennungsmodellen im Bereich maschinelles Lernen und Computer Vision.
Warum sollte ich den Caltech-101-Datensatz in meiner Forschung zitieren?
Das Zitieren des Caltech-101-Datensatzes in deiner Forschung würdigt die Beiträge der Ersteller und bietet eine Referenz für andere, die den Datensatz möglicherweise ebenfalls verwenden. Die empfohlene Zitierweise ist:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Das Zitieren trägt zur Wahrung der Integrität wissenschaftlicher Arbeit bei und hilft Kollegen, die ursprüngliche Quelle zu finden.
Kann ich die Ultralytics Platform für das Training von Modellen auf dem Caltech-101-Datensatz verwenden?
Ja, du kannst die Ultralytics Platform für das Training von Modellen auf dem Caltech-101-Datensatz verwenden. Die Ultralytics Platform bietet eine intuitive Umgebung zur Verwaltung von Datensätzen, zum Trainieren von Modellen und zum Bereitstellen dieser, ohne dass umfangreiche Programmierung erforderlich ist. Für eine detaillierte Anleitung siehe den Blogbeitrag How to train your custom models with Ultralytics Platform.