Overslaan naar inhoud

ImageNet10-dataset

De ImageNet10 dataset is een kleinschalige subset van de ImageNet database, ontwikkeld door Ultralytics en is ontworpen voor CI-tests, sanity checks en het snel testen van trainingslijnen. Deze dataset bestaat uit de eerste afbeelding in de trainingsset en de eerste afbeelding uit de validatieset van de eerste 10 klassen in ImageNet. Hoewel hij aanzienlijk kleiner is, behoudt hij de structuur en diversiteit van de originele ImageNet dataset.

Belangrijkste kenmerken

  • ImageNet10 is een compacte versie van ImageNet, met 20 afbeeldingen die de eerste 10 klassen van de oorspronkelijke dataset vertegenwoordigen.
  • De dataset is georganiseerd volgens de WordNet hiërarchie, die de structuur van de volledige ImageNet dataset weerspiegelt.
  • Het is bij uitstek geschikt voor CI-tests, saniteitscontroles en het snel testen van trainingspijplijnen in computervisietaken.
  • Hoewel het niet ontworpen is voor modelbenchmarking, kan het wel een snelle indicatie geven van de basisfunctionaliteit en correctheid van een model.

Structuur dataset

De ImageNet10 dataset is, net als het originele ImageNet, georganiseerd met behulp van de WordNet hiërarchie. Elk van de 10 klassen in ImageNet10 wordt beschreven door een synset (een verzameling synonieme termen). De afbeeldingen in ImageNet10 zijn geannoteerd met een of meer synsets, waardoor een compacte bron ontstaat voor het testen van modellen om verschillende objecten en hun relaties te herkennen.

Toepassingen

De ImageNet10 dataset is handig voor het snel testen en debuggen van computervisie modellen en pipelines. Het kleine formaat maakt snelle iteratie mogelijk, waardoor het ideaal is voor continue integratietests en sanity checks. De dataset kan ook worden gebruikt voor het snel vooraf testen van nieuwe modellen of wijzigingen aan bestaande modellen, voordat wordt overgegaan op het volledig testen met de complete ImageNet dataset.

Gebruik

Om een deep learning model te testen op de ImageNet10 dataset met een afbeeldingsgrootte van 224x224, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Test Voorbeeld

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet10', epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Voorbeeldafbeeldingen en -annotaties

De ImageNet10 dataset bevat een subset van afbeeldingen uit de originele ImageNet dataset. Deze afbeeldingen zijn gekozen om de eerste 10 klassen in de dataset te vertegenwoordigen, waardoor een diverse maar compacte dataset ontstaat om snel te testen en te evalueren.

Voorbeeldafbeeldingen dataset Het voorbeeld laat de variëteit en complexiteit van de afbeeldingen in de ImageNet10 dataset zien en benadrukt het nut ervan voor het controleren van de juistheid en het snel testen van computervisiemodellen.

Citaten en erkenningen

Als je de ImageNet10 dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het originele ImageNet artikel:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

We willen graag het ImageNet-team bedanken, onder leiding van Olga Russakovsky, Jia Deng en Li Fei-Fei, voor het maken en onderhouden van de ImageNet dataset. De ImageNet10 dataset is weliswaar een compacte subset, maar is een waardevolle bron voor snel testen en debuggen in de machine learning en computer vision onderzoeksgemeenschap. Ga voor meer informatie over de ImageNet dataset en zijn makers naar de ImageNet website.



Gemaakt op 2023-11-12, Bijgewerkt op 2024-01-07
Auteurs: glenn-jocher (4)

Reacties