Overslaan naar inhoud

CIFAR-10 Dataset

De CIFAR-10 (Canadian Institute For Advanced Research) dataset is een verzameling afbeeldingen die veel gebruikt wordt voor machine learning en computer vision algoritmen. Hij is ontwikkeld door onderzoekers van het CIFAR instituut en bestaat uit 60.000 32x32 kleurenafbeeldingen in 10 verschillende klassen.

Belangrijkste kenmerken

  • De CIFAR-10 dataset bestaat uit 60.000 afbeeldingen, verdeeld in 10 klassen.
  • Elke klasse bevat 6.000 afbeeldingen, verdeeld in 5.000 voor training en 1.000 voor testen.
  • De afbeeldingen zijn gekleurd en 32x32 pixels groot.
  • De 10 verschillende klassen stellen vliegtuigen, auto's, vogels, katten, herten, honden, kikkers, paarden, schepen en vrachtwagens voor.
  • CIFAR-10 wordt vaak gebruikt voor het trainen en testen op het gebied van machinaal leren en computervisie.

Structuur dataset

De CIFAR-10 dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Deze subset bestaat uit 10.000 afbeeldingen die worden gebruikt voor het testen en benchmarken van de getrainde modellen.

Toepassingen

De CIFAR-10 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diversiteit van de dataset in termen van klassen en de aanwezigheid van kleurenafbeeldingen maken het een goed afgeronde dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de CIFAR-10 dataset voor 100 epochs met een afbeeldingsgrootte van 32x32, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Voorbeeldafbeeldingen en -annotaties

De CIFAR-10 dataset bevat kleurenafbeeldingen van verschillende objecten en biedt een goed gestructureerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de objecten in de CIFAR-10 dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

Citaten en erkenningen

Als je de CIFAR-10 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende document:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We willen graag Alex Krizhevsky bedanken voor het maken en onderhouden van de CIFAR-10 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de CIFAR-10 dataset en de maker ervan naar de CIFAR-10 dataset website.



Gemaakt op 2023-11-12, Bijgewerkt op 2023-11-22
Auteurs: glenn-jocher (3)

Reacties