Overslaan naar inhoud

ImageNette Dataset

De ImageNette dataset is een subset van de grotere Imagenet dataset, maar bevat slechts 10 gemakkelijk te onderscheiden klassen. Het is gemaakt om een snellere, eenvoudiger te gebruiken versie van Imagenet te bieden voor softwareontwikkeling en onderwijs.

Belangrijkste kenmerken

  • ImageNette bevat afbeeldingen uit 10 verschillende klassen, zoals zeelt, English springer, cassettespeler, kettingzaag, kerk, Franse hoorn, vuilniswagen, benzinepomp, golfbal, parachute.
  • De dataset bestaat uit gekleurde afbeeldingen van verschillende afmetingen.
  • ImageNette wordt veel gebruikt voor het trainen en testen op het gebied van machinaal leren, vooral voor beeldclassificatietaken.

Structuur dataset

De ImageNette dataset is opgesplitst in twee subsets:

  1. Trainingsset: Deze subset bevat enkele duizenden afbeeldingen die worden gebruikt voor het trainen van modellen voor machinaal leren. Het exacte aantal verschilt per klasse.
  2. Validatieset: Deze subset bestaat uit enkele honderden afbeeldingen die worden gebruikt voor het valideren en benchmarken van de getrainde modellen. Ook hier verschilt het exacte aantal per klasse.

Toepassingen

De ImageNette dataset wordt veel gebruikt voor het trainen en evalueren van deep learning modellen in beeldclassificatietaken, zoals Convolutional Neural Networks (CNN's) en diverse andere machine learning algoritmen. Het eenvoudige formaat en de goed gekozen klassen van de dataset maken het een handige bron voor zowel beginnende als ervaren beoefenaars op het gebied van machine learning en computer vision.

Gebruik

Om een model te trainen op de ImageNette dataset voor 100 epochs met een standaard afbeeldingsgrootte van 224x224, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenette", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Voorbeeldafbeeldingen en -annotaties

De ImageNette dataset bevat gekleurde afbeeldingen van verschillende objecten en scènes en biedt daarmee een gevarieerde dataset voor beeldclassificatietaken. Hier zijn enkele voorbeelden van afbeeldingen uit de dataset:

Voorbeeldafbeelding dataset

Het voorbeeld laat de verscheidenheid en complexiteit van de afbeeldingen in de ImageNette dataset zien en benadrukt het belang van een diverse dataset voor het trainen van robuuste beeldclassificatiemodellen.

ImageNette160 en ImageNette320

Voor snellere prototyping en training is de ImageNette dataset ook beschikbaar in twee verkleinde maten: ImageNette160 en ImageNette320. Deze datasets hebben dezelfde klassen en structuur als de volledige ImageNette dataset, maar de afbeeldingen zijn verkleind. Deze versies van de dataset zijn daarom vooral handig voor het testen van modellen of wanneer de rekenkracht beperkt is.

Om deze datasets te gebruiken, vervang je simpelweg 'imagenette' door 'imagenette160' of 'imagenette320' in het trainingscommando. De volgende codefragmenten illustreren dit:

Train Voorbeeld met ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data="imagenette160", epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Train voorbeeld met ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data="imagenette320", epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Deze kleinere versies van de dataset maken snelle iteraties tijdens het ontwikkelingsproces mogelijk, terwijl ze nog steeds waardevolle en realistische beeldclassificatietaken leveren.

Citaten en erkenningen

Als je de ImageNette dataset gebruikt in je onderzoeks- of ontwikkelingswerk, erken deze dan op de juiste manier. Ga voor meer informatie over de ImageNette dataset naar de ImageNette dataset GitHub pagina.

FAQ

Wat is de ImageNette dataset?

De ImageNette dataset is een vereenvoudigde subset van de grotere ImageNet dataset, met slechts 10 gemakkelijk te onderscheiden klassen zoals zeelt, English springer en Franse hoorn. De dataset is gemaakt om een beter hanteerbare dataset te bieden voor het efficiënt trainen en evalueren van beeldclassificatiemodellen. Deze dataset is vooral nuttig voor snelle softwareontwikkeling en educatieve doeleinden op het gebied van machinaal leren en computervisie.

Hoe kan ik de ImageNette dataset gebruiken voor het trainen van een YOLO model?

Om een YOLO model te trainen op de ImageNette dataset voor 100 epochs, kun je de volgende commando's gebruiken. Zorg ervoor dat de omgeving Ultralytics YOLO is ingesteld.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenette", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Raadpleeg de documentatiepagina Training voor meer informatie.

Waarom zou ik ImageNette gebruiken voor beeldclassificatietaken?

De ImageNette dataset is om verschillende redenen voordelig:

  • Snel en eenvoudig: Het bevat slechts 10 klassen, waardoor het minder complex en tijdrovend is in vergelijking met grotere datasets.
  • Educatief gebruik: Ideaal voor het leren en onderwijzen van de basisprincipes van beeldclassificatie, omdat er minder rekenkracht en tijd voor nodig is.
  • Veelzijdigheid: Wijdverbreid gebruikt om verschillende machine learning modellen te trainen en te benchmarken, vooral in beeldclassificatie.

Voor meer details over modeltraining en het beheer van de dataset, bekijk het gedeelte Datasetstructuur.

Kan de ImageNette dataset worden gebruikt met verschillende afbeeldingsformaten?

Ja, de ImageNette dataset is ook beschikbaar in twee verkleinde versies: ImageNette160 en ImageNette320. Deze versies helpen bij het sneller maken van prototypes en zijn vooral handig als de rekenkracht beperkt is.

Train Voorbeeld met ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")

# Train the model with ImageNette160
results = model.train(data="imagenette160", epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Raadpleeg voor meer informatie Training met ImageNette160 en ImageNette320.

Wat zijn enkele praktische toepassingen van de ImageNette dataset?

De ImageNette dataset wordt veel gebruikt in:

  • Educatieve instellingen: Om beginners te onderwijzen in machinaal leren en computervisie.
  • Softwareontwikkeling: Voor snelle prototypering en ontwikkeling van beeldclassificatiemodellen.
  • Onderzoek naar diep leren: Het evalueren en benchmarken van de prestaties van verschillende deep learning modellen, met name Convolutionele Neurale Netwerken (CNN's).

Bekijk het gedeelte Toepassingen voor gedetailleerde use cases.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-07-04
Auteurs: glenn-jocher (6)

Reacties