Caltech-101 Dataset

De Caltech-101 dataset is een veelgebruikte dataset voor objectherkenningstaken en bevat ongeveer 9000 afbeeldingen van 101 objectcategorieën. De categorieën zijn zo gekozen dat ze een afspiegeling zijn van een verscheidenheid aan objecten in de echte wereld en de afbeeldingen zelf zijn zorgvuldig geselecteerd en geannoteerd om een uitdagende benchmark te bieden voor objectherkenningsalgoritmen.

Belangrijkste kenmerken

De Caltech-101 dataset bestaat uit ongeveer 9.000 kleurenfoto's verdeeld over 101 categorieën.
De categorieën omvatten een grote verscheidenheid aan voorwerpen, waaronder dieren, voertuigen, huishoudelijke voorwerpen en mensen.
Het aantal afbeeldingen per categorie varieert, met ongeveer 40 tot 800 afbeeldingen in elke categorie.
Afbeeldingen zijn van verschillende groottes, waarbij de meeste afbeeldingen een gemiddelde resolutie hebben.
Caltech-101 wordt veel gebruikt voor het trainen en testen op het gebied van machinaal leren, met name voor objectherkenningstaken.

Structuur dataset

In tegenstelling tot veel andere datasets is de Caltech-101 dataset niet formeel opgesplitst in een trainings- en een testset. Gebruikers maken meestal hun eigen opsplitsingen op basis van hun specifieke behoeften. Het is echter gebruikelijk om een willekeurige subset van afbeeldingen te gebruiken voor training (bijvoorbeeld 30 afbeeldingen per categorie) en de resterende afbeeldingen voor testen.

Toepassingen

De Caltech-101 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in objectherkenningstaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. Door de grote verscheidenheid aan categorieën en de hoge kwaliteit van de afbeeldingen is het een uitstekende dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de Caltech-101 dataset voor 100 epochs, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst van beschikbare argumenten.

Voorbeeld trein

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech101', epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Voorbeeldafbeeldingen en -annotaties

De Caltech-101 dataset bevat kleurenafbeeldingen van hoge kwaliteit van verschillende objecten en biedt een goed gestructureerde dataset voor objectherkenningstaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de objecten in de Caltech-101 dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste objectherkenningsmodellen.

Citaten en erkenningen

Als je de Caltech-101 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

We willen graag Li Fei-Fei, Rob Fergus en Pietro Perona bedanken voor het maken en onderhouden van de Caltech-101 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de Caltech-101 dataset en de makers ervan naar de Caltech-101 dataset website.

Gemaakt op 2023-11-12, Bijgewerkt op 2023-11-22
Auteurs: glenn-jocher (3)