Overslaan naar inhoud

CIFAR-100 Dataset

De CIFAR-100 (Canadian Institute For Advanced Research) dataset is een aanzienlijke uitbreiding van de CIFAR-10 dataset, bestaande uit 60.000 32x32 kleurenafbeeldingen in 100 verschillende klassen. Hij is ontwikkeld door onderzoekers van het CIFAR instituut en biedt een meer uitdagende dataset voor complexere machine learning en computer vision taken.

Belangrijkste kenmerken

  • De CIFAR-100 dataset bestaat uit 60.000 afbeeldingen, verdeeld in 100 klassen.
  • Elke klasse bevat 600 afbeeldingen, verdeeld in 500 voor training en 100 voor testen.
  • De afbeeldingen zijn gekleurd en 32x32 pixels groot.
  • De 100 verschillende klassen worden gegroepeerd in 20 grove categorieën voor classificatie op een hoger niveau.
  • CIFAR-100 wordt vaak gebruikt voor het trainen en testen op het gebied van machinaal leren en computervisie.

Structuur dataset

De CIFAR-100 dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Deze subset bestaat uit 10.000 afbeeldingen die worden gebruikt voor het testen en benchmarken van de getrainde modellen.

Toepassingen

De CIFAR-100 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diversiteit van de dataset in termen van klassen en de aanwezigheid van kleurenafbeeldingen maken het een meer uitdagende en uitgebreide dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de CIFAR-100 dataset voor 100 epochs met een afbeeldingsgrootte van 32x32, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar100', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Voorbeeldafbeeldingen en -annotaties

De CIFAR-100 dataset bevat kleurenafbeeldingen van verschillende objecten en biedt een goed gestructureerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld toont de variëteit en complexiteit van de objecten in de CIFAR-100 dataset en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

Citaten en erkenningen

Als je de CIFAR-100 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We willen graag Alex Krizhevsky bedanken voor het maken en onderhouden van de CIFAR-100 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de CIFAR-100 dataset en de maker ervan naar de CIFAR-100 dataset website.



Gemaakt op 2023-11-12, Bijgewerkt op 2023-11-22
Auteurs: glenn-jocher (3)

Reacties