Overslaan naar inhoud

CIFAR-100 Dataset

De CIFAR-100 (Canadian Institute For Advanced Research) dataset is een aanzienlijke uitbreiding van de CIFAR-10 dataset, bestaande uit 60.000 32x32 kleurenafbeeldingen in 100 verschillende klassen. Hij is ontwikkeld door onderzoekers van het CIFAR instituut en biedt een meer uitdagende dataset voor complexere machine learning en computer vision taken.

Belangrijkste kenmerken

  • De CIFAR-100 dataset bestaat uit 60.000 afbeeldingen, verdeeld in 100 klassen.
  • Elke klasse bevat 600 afbeeldingen, verdeeld in 500 voor training en 100 voor testen.
  • De afbeeldingen zijn gekleurd en 32x32 pixels groot.
  • De 100 verschillende klassen worden gegroepeerd in 20 grove categorieĆ«n voor classificatie op een hoger niveau.
  • CIFAR-100 wordt vaak gebruikt voor het trainen en testen op het gebied van machinaal leren en computervisie.

Structuur dataset

De CIFAR-100 dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Deze subset bestaat uit 10.000 afbeeldingen die worden gebruikt voor het testen en benchmarken van de getrainde modellen.

Toepassingen

De CIFAR-100 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diversiteit van de dataset in termen van klassen en de aanwezigheid van kleurenafbeeldingen maken het een meer uitdagende en uitgebreide dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de CIFAR-100 dataset voor 100 epochs met een afbeeldingsgrootte van 32x32, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Voorbeeldafbeeldingen en -annotaties

De CIFAR-100 dataset bevat kleurenafbeeldingen van verschillende objecten en biedt een goed gestructureerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld toont de variƫteit en complexiteit van de objecten in de CIFAR-100 dataset en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

Citaten en erkenningen

Als je de CIFAR-100 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende artikel:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We willen graag Alex Krizhevsky bedanken voor het maken en onderhouden van de CIFAR-100 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de CIFAR-100 dataset en de maker ervan naar de CIFAR-100 dataset website.

FAQ

Wat is de CIFAR-100 dataset en waarom is het belangrijk?

De CIFAR-100 dataset is een grote verzameling van 60.000 32x32 kleurenafbeeldingen die zijn ingedeeld in 100 klassen. Hij is ontwikkeld door het Canadian Institute For Advanced Research (CIFAR) en biedt een uitdagende dataset die ideaal is voor complexe taken op het gebied van machinaal leren en computervisie. Het belang ligt in de diversiteit van de klassen en de kleine omvang van de afbeeldingen, waardoor het een waardevolle bron is voor het trainen en testen van deep learning modellen, zoals Convolutional Neural Networks (CNN's), met behulp van frameworks zoals Ultralytics YOLO .

Hoe train ik een YOLO model op de CIFAR-100 dataset?

Je kunt een YOLO model trainen op de CIFAR-100 dataset met de commando's Python of CLI . Hier lees je hoe:

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Kijk voor een uitgebreide lijst met beschikbare argumenten op de pagina Modeltraining.

Wat zijn de belangrijkste toepassingen van de CIFAR-100 dataset?

De CIFAR-100 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen voor beeldclassificatie. De diverse set van 100 klassen, gegroepeerd in 20 grove categorieƫn, biedt een uitdagende omgeving voor het testen van algoritmen zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning benaderingen. Deze dataset is een belangrijke bron voor onderzoek en ontwikkeling op het gebied van machinaal leren en computervisie.

Hoe is de CIFAR-100 dataset opgebouwd?

De CIFAR-100 dataset is opgesplitst in twee subsets:

  1. Trainingsset: Bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Bestaat uit 10.000 afbeeldingen die worden gebruikt voor het testen en benchmarken van de getrainde modellen.

Elk van de 100 klassen bevat 600 afbeeldingen, met 500 afbeeldingen voor training en 100 voor testen, waardoor het bij uitstek geschikt is voor rigoureus academisch en industrieel onderzoek.

Waar kan ik voorbeeldafbeeldingen en annotaties van de CIFAR-100 dataset vinden?

De CIFAR-100 dataset bevat een verscheidenheid aan kleurenafbeeldingen van verschillende objecten, waardoor het een gestructureerde dataset is voor beeldclassificatietaken. Je kunt de documentatiepagina raadplegen om voorbeeldafbeeldingen en annotaties te bekijken. Deze voorbeelden benadrukken de diversiteit en complexiteit van de dataset, wat belangrijk is voor het trainen van robuuste beeldclassificatiemodellen.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-07-04
Auteurs: glenn-jocher (6)

Reacties