Overslaan naar inhoud

Caltech-101 Dataset

De Caltech-101 dataset is een veelgebruikte dataset voor objectherkenningstaken en bevat ongeveer 9000 afbeeldingen van 101 objectcategorieƫn. De categorieƫn zijn zo gekozen dat ze een afspiegeling zijn van een verscheidenheid aan objecten in de echte wereld en de afbeeldingen zelf zijn zorgvuldig geselecteerd en geannoteerd om een uitdagende benchmark te bieden voor objectherkenningsalgoritmen.

Belangrijkste kenmerken

  • De Caltech-101 dataset bestaat uit ongeveer 9.000 kleurenfoto's verdeeld over 101 categorieĆ«n.
  • De categorieĆ«n omvatten een grote verscheidenheid aan voorwerpen, waaronder dieren, voertuigen, huishoudelijke voorwerpen en mensen.
  • Het aantal afbeeldingen per categorie varieert, met ongeveer 40 tot 800 afbeeldingen in elke categorie.
  • Afbeeldingen zijn van verschillende groottes, waarbij de meeste afbeeldingen een gemiddelde resolutie hebben.
  • Caltech-101 wordt veel gebruikt voor het trainen en testen op het gebied van machinaal leren, met name voor objectherkenningstaken.

Structuur dataset

In tegenstelling tot veel andere datasets is de Caltech-101 dataset niet formeel opgesplitst in een trainings- en een testset. Gebruikers maken meestal hun eigen opsplitsingen op basis van hun specifieke behoeften. Het is echter gebruikelijk om een willekeurige subset van afbeeldingen te gebruiken voor training (bijvoorbeeld 30 afbeeldingen per categorie) en de resterende afbeeldingen voor testen.

Toepassingen

De Caltech-101 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in objectherkenningstaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. Door de grote verscheidenheid aan categorieƫn en de hoge kwaliteit van de afbeeldingen is het een uitstekende dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de Caltech-101 dataset voor 100 epochs, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst van beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Voorbeeldafbeeldingen en -annotaties

De Caltech-101 dataset bevat kleurenafbeeldingen van hoge kwaliteit van verschillende objecten en biedt een goed gestructureerde dataset voor objectherkenningstaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de objecten in de Caltech-101 dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste objectherkenningsmodellen.

Citaten en erkenningen

Als je de Caltech-101 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

We willen graag Li Fei-Fei, Rob Fergus en Pietro Perona bedanken voor het maken en onderhouden van de Caltech-101 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de Caltech-101 dataset en de makers ervan naar de Caltech-101 dataset website.

FAQ

Waar wordt de Caltech-101 dataset voor gebruikt bij machinaal leren?

De Caltech-101 dataset wordt veel gebruikt bij machine learning voor objectherkenningstaken. Het bevat ongeveer 9000 afbeeldingen in 101 categorieƫn en vormt een uitdagende benchmark voor het evalueren van objectherkenningsalgoritmen. Onderzoekers gebruiken het om modellen te trainen en te testen, vooral Convolutionele Neurale Netwerken (CNN's) en Support Vector Machines (SVM's), in computer vision.

Hoe kan ik een Ultralytics YOLO model trainen op de Caltech-101 dataset?

Om een Ultralytics YOLO model te trainen op de Caltech-101 dataset, kun je de meegeleverde stukjes code gebruiken. Om bijvoorbeeld 100 epochs te trainen:

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Raadpleeg de pagina Model Training voor meer gedetailleerde argumenten en opties.

Wat zijn de belangrijkste kenmerken van de Caltech-101 dataset?

De Caltech-101 dataset bevat: - Ongeveer 9000 kleurenafbeeldingen in 101 categorieƫn. - Categorieƫn die een breed scala aan objecten omvatten, waaronder dieren, voertuigen en huishoudelijke voorwerpen. - Variabel aantal afbeeldingen per categorie, meestal tussen 40 en 800. - Variabele beeldformaten, de meeste met gemiddelde resolutie.

Deze eigenschappen maken het een uitstekende keuze voor het trainen en evalueren van objectherkenningsmodellen in machine learning en computer vision.

Waarom zou ik de Caltech-101 dataset in mijn onderzoek citeren?

Het citeren van de Caltech-101 dataset in je onderzoek erkent de bijdragen van de makers en biedt een referentie voor anderen die de dataset zouden kunnen gebruiken. De aanbevolen citatie is:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citeren helpt de integriteit van academisch werk te behouden en helpt collega's bij het vinden van de oorspronkelijke bron.

Kan ik Ultralytics HUB gebruiken voor het trainen van modellen op de Caltech-101 dataset?

Ja, je kunt Ultralytics HUB gebruiken voor het trainen van modellen op de Caltech-101 dataset. Ultralytics HUB biedt een intuĆÆtief platform voor het beheren van datasets, het trainen van modellen en het inzetten ervan zonder uitgebreide codering. Raadpleeg voor een gedetailleerde handleiding het blogbericht over hoe je aangepaste modellen kunt trainen met Ultralytics HUB.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-07-04
Auteurs: glenn-jocher (6)

Reacties