Overslaan naar inhoud

ImageNette Dataset

De ImageNette dataset is een subset van de grotere Imagenet dataset, maar bevat slechts 10 gemakkelijk te onderscheiden klassen. Het is gemaakt om een snellere, eenvoudiger te gebruiken versie van Imagenet te bieden voor softwareontwikkeling en onderwijs.

Belangrijkste kenmerken

  • ImageNette bevat afbeeldingen uit 10 verschillende klassen, zoals zeelt, English springer, cassettespeler, kettingzaag, kerk, Franse hoorn, vuilniswagen, benzinepomp, golfbal, parachute.
  • De dataset bestaat uit gekleurde afbeeldingen van verschillende afmetingen.
  • ImageNette wordt veel gebruikt voor het trainen en testen op het gebied van machinaal leren, vooral voor beeldclassificatietaken.

Structuur dataset

De ImageNette dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat enkele duizenden afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren. Het exacte aantal verschilt per klasse.
  2. Validatieset: Deze subset bestaat uit enkele honderden afbeeldingen die worden gebruikt voor het valideren en benchmarken van de getrainde modellen. Ook hier verschilt het exacte aantal per klasse.

Toepassingen

De ImageNette dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's) en diverse andere machine learning algoritmen. Het eenvoudige formaat en de goed gekozen klassen van de dataset maken het een handige bron voor zowel beginnende als ervaren beoefenaars op het gebied van machine learning en computer vision.

Gebruik

Om een model te trainen op de ImageNette dataset voor 100 epochs met een standaard afbeeldingsgrootte van 224x224, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenette', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Voorbeeldafbeeldingen en -annotaties

De ImageNette dataset bevat gekleurde afbeeldingen van verschillende objecten en scènes en biedt daarmee een gevarieerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de afbeeldingen in de ImageNette dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

ImageNette160 en ImageNette320

Voor snellere prototyping en training is de ImageNette dataset ook beschikbaar in twee verkleinde maten: ImageNette160 en ImageNette320. Deze datasets hebben dezelfde klassen en structuur als de volledige ImageNette dataset, maar de afbeeldingen zijn verkleind. Deze versies van de dataset zijn daarom vooral handig voor het testen van modellen of wanneer de rekenkracht beperkt is.

Om deze datasets te gebruiken, vervang je simpelweg 'imagenette' door 'imagenette160' of 'imagenette320' in het trainingscommando. De volgende codefragmenten illustreren dit:

Train Voorbeeld met ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data='imagenette160', epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Train voorbeeld met ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data='imagenette320', epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Deze kleinere versies van de dataset maken snelle iteraties tijdens het ontwikkelingsproces mogelijk, terwijl ze nog steeds waardevolle en realistische beeldclassificatietaken leveren.

Citaten en erkenningen

Als je de ImageNette dataset gebruikt in je onderzoeks- of ontwikkelingswerk, erken deze dan op de juiste manier. Ga voor meer informatie over de ImageNette dataset naar de ImageNette dataset GitHub pagina.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-01-12
Auteurs: glenn-jocher (3)

Reacties