Zum Inhalt springen

Caltech-101-Datensatz

Der Caltech-101-Datensatz ist ein weit verbreiteter Datensatz fĂŒr Objekterkennungsaufgaben und enthĂ€lt rund 9.000 Bilder aus 101 Objektkategorien. Die Kategorien wurden so gewĂ€hlt, dass sie eine Vielzahl von Objekten aus der realen Welt widerspiegeln. Die Bilder selbst wurden sorgfĂ€ltig ausgewĂ€hlt und beschriftet, um einen anspruchsvollen Benchmark fĂŒr Objekterkennungsalgorithmen zu bieten.

Hauptmerkmale

  • Der Caltech-101-Datensatz umfasst rund 9.000 Farbbilder, die in 101 Kategorien unterteilt sind.
  • Die Kategorien umfassen eine Vielzahl von Objekten, darunter Tiere, Fahrzeuge, HaushaltsgegenstĂ€nde und Menschen.
  • Die Anzahl der Bilder pro Kategorie variiert und liegt zwischen 40 und 800 Bildern pro Kategorie.
  • Die Bilder haben unterschiedliche GrĂ¶ĂŸen, wobei die meisten Bilder eine mittlere Auflösung haben.
  • Caltech-101 wird hĂ€ufig zum Trainieren und Testen im Bereich des maschinellen Lernens verwendet, insbesondere fĂŒr Aufgaben der Objekterkennung.

Struktur des Datensatzes

Im Gegensatz zu vielen anderen DatensĂ€tzen ist der Caltech-101-Datensatz nicht formell in Trainings- und TestdatensĂ€tze aufgeteilt. In der Regel erstellen die Nutzerinnen und Nutzer ihre eigene Aufteilung, die auf ihre speziellen BedĂŒrfnisse zugeschnitten ist. Eine gĂ€ngige Praxis ist jedoch, eine zufĂ€llige Teilmenge von Bildern fĂŒr das Training zu verwenden (z. B. 30 Bilder pro Kategorie) und die restlichen Bilder fĂŒr die Tests.

Anwendungen

Der Caltech-101-Datensatz wird hĂ€ufig zum Trainieren und Evaluieren von Deep-Learning-Modellen fĂŒr Objekterkennungsaufgaben verwendet, z. B. fĂŒr Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) und verschiedene andere maschinelle Lernalgorithmen. Die große Vielfalt an Kategorien und die hohe QualitĂ€t der Bilder machen ihn zu einem ausgezeichneten Datensatz fĂŒr die Forschung und Entwicklung auf dem Gebiet des maschinellen Lernens und der Computer Vision.

Verwendung

Um ein Modell YOLO auf dem Caltech-101-Datensatz fĂŒr 100 Epochen zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Beispielbilder und Anmerkungen

Der Caltech-101-Datensatz enthĂ€lt hochwertige Farbbilder von verschiedenen Objekten, die einen gut strukturierten Datensatz fĂŒr Objekterkennungsaufgaben darstellen. Hier sind einige Beispiele fĂŒr Bilder aus diesem Datensatz:

Datensatz Beispielbild

Das Beispiel zeigt die Vielfalt und KomplexitĂ€t der Objekte im Caltech-101-Datensatz und unterstreicht die Bedeutung eines vielfĂ€ltigen Datensatzes fĂŒr das Training robuster Objekterkennungsmodelle.

Zitate und Danksagungen

Wenn du den Caltech-101-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Dokument:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Wir möchten Li Fei-Fei, Rob Fergus und Pietro Perona dafĂŒr danken, dass sie den Caltech-101-Datensatz als wertvolle Ressource fĂŒr die Forschungsgemeinschaft im Bereich des maschinellen Lernens und der Computer Vision erstellt und gepflegt haben. Weitere Informationen ĂŒber den Caltech-101-Datensatz und seine Schöpfer findest du auf der Website des Caltech-101-Datensatzes.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Kommentare