Overslaan naar inhoud

Caltech-256 Dataset

De Caltech-256 dataset is een uitgebreide verzameling afbeeldingen die gebruikt wordt voor objectclassificatietaken. Het bevat ongeveer 30.000 afbeeldingen verdeeld in 257 categorieën (256 objectcategorieën en 1 achtergrondcategorie). De afbeeldingen zijn zorgvuldig gecureerd en geannoteerd om een uitdagende en diverse benchmark te bieden voor objectherkenningsalgoritmen.

Belangrijkste kenmerken

  • De Caltech-256 dataset bestaat uit ongeveer 30.000 kleurenfoto's verdeeld in 257 categorieën.
  • Elke categorie bevat minimaal 80 afbeeldingen.
  • De categorieën omvatten een grote verscheidenheid aan echte voorwerpen, waaronder dieren, voertuigen, huishoudelijke artikelen en mensen.
  • Afbeeldingen zijn van verschillende groottes en resoluties.
  • Caltech-256 wordt veel gebruikt voor training en testen op het gebied van machinaal leren, met name voor objectherkenningstaken.

Structuur dataset

Net als Caltech-101 heeft de Caltech-256 dataset geen formele splitsing tussen training en testsets. Gebruikers maken meestal hun eigen splitsingen op basis van hun specifieke behoeften. Het is gebruikelijk om een willekeurige subset van afbeeldingen te gebruiken voor training en de overige afbeeldingen voor testen.

Toepassingen

De Caltech-256 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in objectherkenningstaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diverse categorieën en afbeeldingen van hoge kwaliteit maken het een dataset van onschatbare waarde voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de Caltech-256 dataset voor 100 epochs, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst van beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech256', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Voorbeeldafbeeldingen en -annotaties

De Caltech-256 dataset bevat kleurenafbeeldingen van hoge kwaliteit van verschillende objecten en biedt daarmee een uitgebreide dataset voor objectherkenningstaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset(credit):

Voorbeeldafbeelding dataset

Het voorbeeld toont de diversiteit en complexiteit van de objecten in de Caltech-256 dataset en benadrukt het belang van een gevarieerde dataset voor het trainen van robuuste objectherkenningsmodellen.

Citaten en erkenningen

Als je de Caltech-256 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

We willen graag Gregory Griffin, Alex Holub en Pietro Perona bedanken voor het maken en onderhouden van de Caltech-256 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Voor meer informatie over de

Caltech-256 dataset en de makers ervan, bezoek de Caltech-256 dataset website.



Gemaakt op 2023-11-12, Bijgewerkt op 2023-11-22
Auteurs: glenn-jocher (3)

Reacties