Link to this sectionCaltech-101-Datensatz#
Der Caltech-101-Datensatz ist ein weit verbreiteter Datensatz für Objekterkennungsaufgaben und enthält etwa 9.000 Bilder aus 101 Objektkategorien. Die Kategorien wurden ausgewählt, um eine Vielzahl von Objekten aus der realen Welt widerzuspiegeln, und die Bilder selbst wurden sorgfältig ausgewählt und annotiert, um einen anspruchsvollen Benchmark für Objekterkennungsalgorithmen zu bieten.
Der Caltech-101-Datensatz wird ohne vordefinierte Trainings-/Validierungs-Splits bereitgestellt. Wenn du jedoch die Trainingsbefehle aus den unten aufgeführten Anwendungsbeispielen verwendest, teilt das Ultralytics-Framework den Datensatz automatisch für dich auf. Standardmäßig werden 80 % für den Trainingssatz und 20 % für den Validierungssatz verwendet.
Link to this sectionHauptfunktionen#
- Der Caltech-101-Datensatz umfasst etwa 9.000 Farbbilder, die in 101 Kategorien unterteilt sind.
- Die Kategorien umfassen eine große Vielfalt an Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
- Die Anzahl der Bilder pro Kategorie variiert und liegt bei etwa 40 bis 800 Bildern pro Kategorie.
- Die Bilder haben unterschiedliche Größen, wobei die meisten Bilder eine mittlere Auflösung aufweisen.
- Caltech-101 wird häufig für das Training und Testen im Bereich Machine Learning eingesetzt, insbesondere für Aufgaben der Objekterkennung.
Link to this sectionDatensatzstruktur#
Im Gegensatz zu vielen anderen Datensätzen ist der Caltech-101-Datensatz nicht formal in Trainings- und Testsets unterteilt. Benutzer erstellen üblicherweise ihre eigenen Splits basierend auf ihren spezifischen Anforderungen. Eine gängige Praxis ist jedoch die Verwendung einer zufälligen Teilmenge von Bildern für das Training (z. B. 30 Bilder pro Kategorie) und der verbleibenden Bilder für den Test.
Link to this sectionAnwendungen#
Der Caltech-101-Datensatz wird ausgiebig zum Trainieren und Evaluieren von Deep Learning-Modellen für Objekterkennungsaufgaben verwendet, wie etwa Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Machine-Learning-Algorithmen. Seine große Auswahl an Kategorien und die hochwertigen Bilder machen ihn zu einem hervorragenden Datensatz für Forschung und Entwicklung im Bereich Machine Learning und Computer Vision.
Link to this sectionVerwendung#
Um ein YOLO-Modell für 100 Epochen auf dem Caltech-101-Datensatz zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionBeispielbilder und Annotationen#
Der Caltech-101-Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungsaufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:

Das Beispiel zeigt die Vielfalt und Komplexität der Objekte im Caltech-101-Datensatz und unterstreicht die Bedeutung eines diversen Datensatzes für das Training robuster Objekterkennungsmodelle.
Link to this sectionZitate und Danksagungen#
Wenn du den Caltech-101-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Wir möchten Li Fei-Fei, Rob Fergus und Pietro Perona dafür danken, dass sie den Caltech-101-Datensatz als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft erstellt und gepflegt haben. Weitere Informationen über den Caltech-101-Datensatz und seine Ersteller findest du auf der Caltech-101-Datensatz-Website.
Link to this sectionFAQ#
Link to this sectionWofür wird der Caltech-101-Datensatz im Machine Learning verwendet?#
Der Caltech-101-Datensatz wird im Machine Learning häufig für Objekterkennungsaufgaben genutzt. Er enthält etwa 9.000 Bilder in 101 Kategorien und bietet einen anspruchsvollen Benchmark für die Evaluierung von Objekterkennungsalgorithmen. Forscher nutzen ihn zum Trainieren und Testen von Modellen, insbesondere Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) im Bereich Computer Vision.
Link to this sectionWie kann ich ein Ultralytics YOLO-Modell mit dem Caltech-101-Datensatz trainieren?#
Um ein Ultralytics YOLO-Modell mit dem Caltech-101-Datensatz zu trainieren, kannst du die bereitgestellten Code-Snippets verwenden. Zum Beispiel für ein Training über 100 Epochen:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Weitere detaillierte Argumente und Optionen findest du auf der Seite zum Modell-Training.
Link to this sectionWas sind die Hauptmerkmale des Caltech-101-Datensatzes?#
Der Caltech-101-Datensatz umfasst:
- Etwa 9.000 Farbbilder in 101 Kategorien.
- Kategorien, die eine vielfältige Auswahl an Objekten abdecken, darunter Tiere, Fahrzeuge und Haushaltsgegenstände.
- Eine variable Anzahl von Bildern pro Kategorie, typischerweise zwischen 40 und 800.
- Unterschiedliche Bildgrößen, wobei die meisten eine mittlere Auflösung haben.
Diese Merkmale machen ihn zu einer ausgezeichneten Wahl für das Training und die Evaluierung von Objekterkennungsmodellen in den Bereichen Machine Learning und Computer Vision.
Link to this sectionWarum sollte ich den Caltech-101-Datensatz in meiner Forschung zitieren?#
Das Zitieren des Caltech-101-Datensatzes in deiner Forschung würdigt die Beiträge der Ersteller und bietet eine Referenz für andere, die den Datensatz ebenfalls verwenden könnten. Die empfohlene Zitierweise lautet:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Das Zitieren trägt zur Wahrung der Integrität wissenschaftlicher Arbeiten bei und hilft Fachkollegen dabei, die ursprüngliche Quelle zu finden.
Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle mit dem Caltech-101-Datensatz zu trainieren?#
Ja, du kannst die Ultralytics Platform verwenden, um Modelle mit dem Caltech-101-Datensatz zu trainieren. Die Ultralytics Platform bietet eine intuitive Umgebung zum Verwalten von Datensätzen, Trainieren von Modellen und deren Bereitstellung ohne umfangreiche Programmierung. Eine detaillierte Anleitung findest du im Blog-Beitrag Wie du deine benutzerdefinierten Modelle mit der Ultralytics Platform trainierst.