Overslaan naar inhoud

CIFAR-10 Dataset

De CIFAR-10 (Canadian Institute For Advanced Research) dataset is een verzameling afbeeldingen die veel gebruikt wordt voor machine learning en computer vision algoritmen. Hij is ontwikkeld door onderzoekers van het CIFAR instituut en bestaat uit 60.000 32x32 kleurenafbeeldingen in 10 verschillende klassen.



Kijken: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLOv8

Belangrijkste kenmerken

  • De CIFAR-10 dataset bestaat uit 60.000 afbeeldingen, verdeeld in 10 klassen.
  • Elke klasse bevat 6.000 afbeeldingen, verdeeld in 5.000 voor training en 1.000 voor testen.
  • De afbeeldingen zijn gekleurd en 32x32 pixels groot.
  • De 10 verschillende klassen stellen vliegtuigen, auto's, vogels, katten, herten, honden, kikkers, paarden, schepen en vrachtwagens voor.
  • CIFAR-10 wordt vaak gebruikt voor het trainen en testen op het gebied van machinaal leren en computervisie.

Structuur dataset

De CIFAR-10 dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Deze subset bestaat uit 10.000 afbeeldingen die worden gebruikt voor het testen en benchmarken van de getrainde modellen.

Toepassingen

De CIFAR-10 dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's), Support Vector Machines (SVM's) en diverse andere machine learning algoritmen. De diversiteit van de dataset in termen van klassen en de aanwezigheid van kleurenafbeeldingen maken het een goed afgeronde dataset voor onderzoek en ontwikkeling op het gebied van machine learning en computer vision.

Gebruik

Om een YOLO model te trainen op de CIFAR-10 dataset voor 100 epochs met een afbeeldingsgrootte van 32x32, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Voorbeeldafbeeldingen en -annotaties

De CIFAR-10 dataset bevat kleurenafbeeldingen van verschillende objecten en biedt een goed gestructureerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de objecten in de CIFAR-10 dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

Citaten en erkenningen

Als je de CIFAR-10 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende document:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We willen graag Alex Krizhevsky bedanken voor het maken en onderhouden van de CIFAR-10 dataset als een waardevolle bron voor de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de CIFAR-10 dataset en de maker ervan naar de CIFAR-10 dataset website.

FAQ

Hoe kan ik een YOLO model trainen op de CIFAR-10 dataset?

Om een YOLO model te trainen op de CIFAR-10 dataset met Ultralytics, kun je de voorbeelden volgen voor zowel Python als CLI. Hier is een basisvoorbeeld om je model te trainen voor 100 epochs met een afbeeldingsgrootte van 32x32 pixels:

Voorbeeld

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Raadpleeg de pagina Model Training voor meer informatie.

Wat zijn de belangrijkste kenmerken van de CIFAR-10 dataset?

De CIFAR-10 dataset bestaat uit 60.000 kleurenafbeeldingen verdeeld in 10 klassen. Elke klasse bevat 6.000 afbeeldingen, waarvan 5.000 voor training en 1.000 voor testen. De afbeeldingen zijn 32x32 pixels groot en variƫren in de volgende categorieƫn:

  • Vliegtuigen
  • Auto's
  • Vogels
  • Katten
  • Herten
  • Honden
  • Kikkers
  • Paarden
  • Schepen
  • Vrachtwagens

Deze gevarieerde dataset is essentieel voor het trainen van beeldclassificatiemodellen op gebieden als machinaal leren en computervisie. Ga voor meer informatie naar de CIFAR-10 secties over de structuur van de dataset en toepassingen.

Waarom de CIFAR-10 dataset gebruiken voor beeldclassificatietaken?

De CIFAR-10 dataset is een uitstekende benchmark voor beeldclassificatie vanwege de diversiteit en structuur. Het bevat een evenwichtige mix van 60.000 gelabelde afbeeldingen in 10 verschillende categorieƫn, wat helpt bij het trainen van robuuste en gegeneraliseerde modellen. Het wordt veel gebruikt voor het evalueren van deep learning modellen, waaronder Convolutional Neural Networks (CNN's) en andere machine learning algoritmen. De dataset is relatief klein, waardoor hij geschikt is voor snelle experimenten en algoritmeontwikkeling. Ontdek de vele toepassingen in de sectie Toepassingen.

Hoe is de CIFAR-10 dataset opgebouwd?

De CIFAR-10 dataset is onderverdeeld in twee subsets:

  1. Trainingsset: Bevat 50.000 afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren.
  2. Testset: Bestaat uit 10.000 afbeeldingen voor het testen en benchmarken van de getrainde modellen.

Elke subset bestaat uit afbeeldingen die zijn ingedeeld in 10 klassen, waarvan de annotaties direct beschikbaar zijn voor modeltraining en -evaluatie. Raadpleeg voor meer gedetailleerde informatie de sectie over de structuur van de dataset.

Hoe kan ik de CIFAR-10 dataset citeren in mijn onderzoek?

Als je de CIFAR-10 dataset gebruikt in je onderzoeks- of ontwikkelingsprojecten, zorg er dan voor dat je het volgende artikel citeert:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Het erkennen van de makers van de dataset helpt om verder onderzoek en ontwikkeling op dit gebied te ondersteunen. Voor meer details, zie de citaten en dankbetuigingen sectie.

Wat zijn enkele praktische voorbeelden van het gebruik van de CIFAR-10 dataset?

De CIFAR-10 dataset wordt vaak gebruikt voor het trainen van beeldclassificatiemodellen, zoals Convolutional Neural Networks (CNN's) en Support Vector Machines (SVM's). Deze modellen kunnen worden gebruikt in verschillende computer vision taken, waaronder objectdetectie, beeldherkenning en geautomatiseerd taggen. Bekijk de codefragmenten in het gedeelte over gebruik om enkele praktische voorbeelden te zien.



Created 2023-11-12, Updated 2024-07-12
Authors: RizwanMunawar (1), glenn-jocher (6)

Reacties