Overslaan naar inhoud

Caltech-256 Dataset

De Caltech-256 dataset is een uitgebreide verzameling afbeeldingen die gebruikt wordt voor objectclassificatietaken. Het bevat ongeveer 30.000 afbeeldingen verdeeld in 257 categorieƫn (256 objectcategorieƫn en 1 achtergrondcategorie). De afbeeldingen zijn zorgvuldig gecureerd en geannoteerd om een uitdagende en diverse benchmark te bieden voor objectherkenningsalgoritmen.



Kijken: Beeldclassificatiemodel trainen met Caltech-256 dataset met Ultralytics HUB

Belangrijkste kenmerken

  • De Caltech-256 dataset bestaat uit ongeveer 30.000 kleurenfoto's verdeeld in 257 categorieĆ«n.
  • Elke categorie bevat minimaal 80 afbeeldingen.
  • De categorieĆ«n omvatten een grote verscheidenheid aan echte voorwerpen, waaronder dieren, voertuigen, huishoudelijke artikelen en mensen.
  • Afbeeldingen zijn van verschillende groottes en resoluties.
  • Caltech-256 wordt veel gebruikt voor training en testen op het gebied van machinaal leren, met name voor objectherkenningstaken.

Structuur dataset

Net als Caltech-101 heeft de Caltech-256 dataset geen formele splitsing tussen training en testsets. Gebruikers maken meestal hun eigen splitsingen op basis van hun specifieke behoeften. Het is gebruikelijk om een willekeurige subset van afbeeldingen te gebruiken voor training en de overige afbeeldingen voor testen.

Toepassingen

De Caltech-256 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in objectherkenningstaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diverse categorieƫn en afbeeldingen van hoge kwaliteit maken het een dataset van onschatbare waarde voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de Caltech-256 dataset voor 100 epochs, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst van beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Voorbeeldafbeeldingen en -annotaties

De Caltech-256 dataset bevat kleurenafbeeldingen van hoge kwaliteit van verschillende objecten en biedt daarmee een uitgebreide dataset voor objectherkenningstaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset(credit):

Voorbeeldafbeelding dataset

Het voorbeeld toont de diversiteit en complexiteit van de objecten in de Caltech-256 dataset en benadrukt het belang van een gevarieerde dataset voor het trainen van robuuste objectherkenningsmodellen.

Citaten en erkenningen

Als je de Caltech-256 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

We willen graag Gregory Griffin, Alex Holub en Pietro Perona bedanken voor het maken en onderhouden van de Caltech-256 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Voor meer informatie over de

Caltech-256 dataset en de makers ervan, bezoek de Caltech-256 dataset website.

FAQ

Wat is de Caltech-256 dataset en waarom is deze belangrijk voor machinaal leren?

De Caltech-256 dataset is een grote beelddataset die voornamelijk wordt gebruikt voor objectclassificatietaken in machinaal leren en computer vision. De dataset bestaat uit ongeveer 30.000 kleurenafbeeldingen verdeeld over 257 categorieƫn, die een breed scala aan objecten uit de echte wereld omvatten. Door de diversiteit en hoge kwaliteit van de afbeeldingen is de dataset een uitstekende benchmark voor het evalueren van algoritmen voor objectherkenning, wat cruciaal is voor het ontwikkelen van robuuste modellen voor machinaal leren.

Hoe kan ik een YOLO model trainen op de Caltech-256 dataset met Python of CLI?

Om een YOLO model te trainen op de Caltech-256 dataset voor 100 epochs, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor aanvullende opties.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Wat zijn de meest voorkomende gebruikssituaties voor de Caltech-256 dataset?

De Caltech-256 dataset wordt veel gebruikt voor verschillende objectherkenningstaken zoals:

  • Convolutionele neurale netwerken (CNN's) trainen
  • De prestaties van Support Vector Machines (SVM's) evalueren
  • Benchmarking van nieuwe algoritmen voor diep leren
  • Objectdetectiemodellen ontwikkelen met frameworks als Ultralytics YOLO

De diversiteit en uitgebreide annotaties maken het ideaal voor onderzoek en ontwikkeling in machine learning en computer vision.

Hoe is de Caltech-256 dataset opgebouwd en opgesplitst voor training en testen?

De Caltech-256 dataset wordt niet geleverd met een vooraf gedefinieerde splitsing voor training en testen. Gebruikers maken meestal hun eigen opsplitsingen op basis van hun specifieke behoeften. Een gebruikelijke aanpak is om willekeurig een subset van beelden te selecteren voor training en de overige beelden te gebruiken voor testen. Door deze flexibiliteit kunnen gebruikers de dataset aanpassen aan hun specifieke projecteisen en experimentele opstellingen.

Waarom zou ik Ultralytics YOLO gebruiken voor het trainen van modellen op de Caltech-256 dataset?

Ultralytics YOLO modellen bieden verschillende voordelen voor training op de Caltech-256 dataset:

  • Hoge nauwkeurigheid: YOLO modellen staan bekend om hun geavanceerde prestaties in objectdetectietaken.
  • Snelheid: Ze bieden realtime inferentiemogelijkheden, waardoor ze geschikt zijn voor toepassingen die snelle voorspellingen vereisen.
  • Gebruiksgemak: Met Ultralytics HUB kunnen gebruikers modellen trainen, valideren en implementeren zonder uitgebreide codering.
  • Voorgetrainde modellen: Uitgaande van voorgetrainde modellen, zoals yolov8n-cls.ptkan de trainingstijd aanzienlijk verkorten en de nauwkeurigheid van het model verbeteren.

Lees voor meer details onze uitgebreide trainingsgids.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-07-18
Auteurs: RizwanMunawar (1), glenn-jocher (6)

Reacties