Meet YOLO26: next-gen vision AI.

Link to this sectionCaltech-101-Datensatz#

Der Caltech-101-Datensatz ist ein weit verbreiteter Datensatz für Objekterkennungsaufgaben, der etwa 9.000 Bilder aus 101 Objektkategorien enthält. Die Kategorien wurden so gewählt, dass sie eine Vielzahl realer Objekte widerspiegeln, und die Bilder selbst wurden sorgfältig ausgewählt und annotiert, um einen anspruchsvollen Benchmark für Objekterkennungsalgorithmen zu bieten.



Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform
Automatische Datenaufteilung

Der Caltech-101-Datensatz wird ohne vordefinierte Trainings-/Validierungsaufteilungen bereitgestellt. Wenn du jedoch die in den Anwendungsbeispielen unten aufgeführten Trainingsbefehle verwendest, teilt das Ultralytics-Framework den Datensatz automatisch für dich auf. Die Standardaufteilung beträgt 80 % für den Trainingssatz und 20 % für den Validierungssatz.

Link to this sectionHauptfunktionen#

  • Der Caltech-101-Datensatz besteht aus etwa 9.000 Farbbildern, die in 101 Kategorien unterteilt sind.
  • Die Kategorien umfassen eine große Vielfalt an Objekten, darunter Tiere, Fahrzeuge, Haushaltsgegenstände und Menschen.
  • Die Anzahl der Bilder pro Kategorie variiert und liegt bei etwa 40 bis 800 Bildern pro Kategorie.
  • Die Bilder haben unterschiedliche Größen, wobei die meisten eine mittlere Auflösung aufweisen.
  • Caltech-101 wird häufig für Training und Tests im Bereich Machine Learning verwendet, insbesondere für Objekterkennungsaufgaben.

Link to this sectionDatensatzstruktur#

Im Gegensatz zu vielen anderen Datensätzen ist der Caltech-101-Datensatz nicht formal in Trainings- und Testsätze unterteilt. Benutzer erstellen üblicherweise ihre eigenen Aufteilungen basierend auf ihren spezifischen Anforderungen. Eine gängige Praxis ist jedoch die Verwendung einer zufälligen Teilmenge von Bildern für das Training (z. B. 30 Bilder pro Kategorie) und der verbleibenden Bilder für den Test.

Link to this sectionAnwendungen#

Der Caltech-101-Datensatz wird umfassend für das Training und die Evaluierung von Deep Learning-Modellen bei Objekterkennungsaufgaben eingesetzt, wie etwa Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedenen anderen Machine-Learning-Algorithmen. Seine große Vielfalt an Kategorien und die hochwertigen Bilder machen ihn zu einem hervorragenden Datensatz für Forschung und Entwicklung im Bereich Machine Learning und Computer Vision.

Link to this sectionVerwendung#

Um ein YOLO-Modell auf dem Caltech-101-Datensatz für 100 Epochen zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Modell-Training-Seite.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionBeispielbilder und Annotationen#

Der Caltech-101-Datensatz enthält hochwertige Farbbilder verschiedener Objekte und bietet einen gut strukturierten Datensatz für Bildklassifizierungs-Aufgaben. Hier sind einige Beispiele für Bilder aus dem Datensatz:

Caltech-101-Bildklassifizierungsdatensatz-Beispiele

Das Beispiel veranschaulicht die Vielfalt und Komplexität der Objekte im Caltech-101-Datensatz und unterstreicht die Bedeutung eines vielfältigen Datensatzes für das Training robuster Objekterkennungsmodelle.

Link to this sectionZitate und Danksagungen#

Wenn du den Caltech-101-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Wir möchten Li Fei-Fei, Rob Fergus und Pietro Perona dafür danken, dass sie den Caltech-101-Datensatz erstellt und als wertvolle Ressource für die Machine-Learning- und Computer-Vision-Forschungsgemeinschaft gepflegt haben. Weitere Informationen über den Caltech-101-Datensatz und seine Ersteller findest du auf der Caltech-101-Datensatz-Website.

Link to this sectionFAQ#

Link to this sectionWofür wird der Caltech-101-Datensatz im Machine Learning verwendet?#

Der Caltech-101-Datensatz wird im Machine Learning häufig für Objekterkennungsaufgaben verwendet. Er enthält etwa 9.000 Bilder in 101 Kategorien und bietet einen anspruchsvollen Benchmark für die Evaluierung von Objekterkennungsalgorithmen. Forscher nutzen ihn zum Trainieren und Testen von Modellen, insbesondere für Convolutional Neural Networks (CNNs) und Support Vector Machines (SVMs) im Bereich Computer Vision.

Link to this sectionWie kann ich ein Ultralytics YOLO-Modell auf dem Caltech-101-Datensatz trainieren?#

Um ein Ultralytics YOLO-Modell auf dem Caltech-101-Datensatz zu trainieren, kannst du die bereitgestellten Code-Snippets verwenden. Zum Beispiel für ein Training über 100 Epochen:

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Detailliertere Argumente und Optionen findest du auf der Modell-Training-Seite.

Link to this sectionWas sind die Hauptmerkmale des Caltech-101-Datensatzes?#

Der Caltech-101-Datensatz umfasst:

  • Etwa 9.000 Farbbilder in 101 Kategorien.
  • Kategorien, die eine vielfältige Palette von Objekten abdecken, einschließlich Tieren, Fahrzeugen und Haushaltsgegenständen.
  • Eine variable Anzahl von Bildern pro Kategorie, typischerweise zwischen 40 und 800.
  • Variable Bildgrößen, wobei die meisten eine mittlere Auflösung haben.

Diese Merkmale machen ihn zu einer ausgezeichneten Wahl für das Training und die Evaluierung von Objekterkennungsmodellen in Machine Learning und Computer Vision.

Link to this sectionWarum sollte ich den Caltech-101-Datensatz in meiner Forschung zitieren?#

Das Zitieren des Caltech-101-Datensatzes in deiner Forschung würdigt die Beiträge der Ersteller und bietet eine Referenz für andere, die den Datensatz möglicherweise verwenden. Die empfohlene Zitierweise lautet:

Zitat
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Das Zitieren trägt zur Wahrung der Integrität wissenschaftlicher Arbeit bei und unterstützt Fachkollegen dabei, die ursprüngliche Quelle zu finden.

Link to this sectionKann ich die Ultralytics Platform verwenden, um Modelle auf dem Caltech-101-Datensatz zu trainieren?#

Ja, du kannst die Ultralytics Platform verwenden, um Modelle auf dem Caltech-101-Datensatz zu trainieren. Die Ultralytics Platform bietet eine intuitive Plattform zur Verwaltung von Datensätzen, zum Trainieren von Modellen und zu deren Bereitstellung ohne umfangreiche Programmierarbeit. Eine detaillierte Anleitung findest du im Blog-Beitrag zum Thema wie du deine eigenen Modelle mit der Ultralytics Platform trainierst.

Kommentare