Zum Inhalt springen

ImageNet10-Datensatz

Der ImageNet10-Datensatz ist eine kleine Teilmenge der ImageNet-Datenbank, die von Ultralytics entwickelt wurde und fĂŒr CI-Tests, PlausibilitĂ€tsprĂŒfungen und das schnelle Testen von Trainingspipelines gedacht ist. Dieser Datensatz besteht aus dem ersten Bild des Trainingssets und dem ersten Bild des Validierungssets der ersten 10 Klassen in ImageNet. Obwohl er deutlich kleiner ist, behĂ€lt er die Struktur und Vielfalt des ursprĂŒnglichen ImageNet-Datensatzes bei.

Hauptmerkmale

  • ImageNet10 ist eine kompakte Version von ImageNet, mit 20 Bildern, die die ersten 10 Klassen des Originaldatensatzes reprĂ€sentieren.
  • Der Datensatz ist entsprechend der WordNet-Hierarchie organisiert und spiegelt die Struktur des kompletten ImageNet-Datensatzes wider.
  • Sie eignet sich ideal fĂŒr CI-Tests, PlausibilitĂ€tsprĂŒfungen und das schnelle Testen von Trainingspipelines fĂŒr Computer Vision Aufgaben.
  • Obwohl es nicht fĂŒr den Modell-Benchmark gedacht ist, kann es einen schnellen Hinweis auf die grundlegende FunktionalitĂ€t und Korrektheit eines Modells geben.

Struktur des Datensatzes

Der ImageNet10-Datensatz ist wie das ursprĂŒngliche ImageNet nach der WordNet-Hierarchie organisiert. Jede der 10 Klassen in ImageNet10 wird durch ein Synset (eine Sammlung von synonymen Begriffen) beschrieben. Die Bilder in ImageNet10 sind mit einem oder mehreren Synsets versehen und bieten so eine kompakte Ressource zum Testen von Modellen zur Erkennung verschiedener Objekte und ihrer Beziehungen.

Anwendungen

Der ImageNet10-Datensatz ist nĂŒtzlich, um Computer-Vision-Modelle und -Pipelines schnell zu testen und zu debuggen. Seine geringe GrĂ¶ĂŸe ermöglicht eine schnelle Iteration und ist daher ideal fĂŒr kontinuierliche Integrationstests und PlausibilitĂ€tsprĂŒfungen. Er kann auch fĂŒr schnelle Vorabtests neuer Modelle oder Änderungen an bestehenden Modellen verwendet werden, bevor mit dem kompletten ImageNet-Datensatz getestet wird.

Verwendung

Um ein Deep Learning-Modell auf dem ImageNet10-Datensatz mit einer BildgrĂ¶ĂŸe von 224x224 zu testen, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Test Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Beispielbilder und Anmerkungen

Der ImageNet10-Datensatz enthĂ€lt eine Teilmenge von Bildern aus dem ursprĂŒnglichen ImageNet-Datensatz. Diese Bilder wurden so ausgewĂ€hlt, dass sie die ersten 10 Klassen des Datensatzes reprĂ€sentieren und einen vielfĂ€ltigen und dennoch kompakten Datensatz fĂŒr schnelle Tests und Auswertungen bieten.

Datensatz Beispielbilder Das Beispiel zeigt die Vielfalt und KomplexitĂ€t der Bilder im ImageNet10-Datensatz und unterstreicht seine NĂŒtzlichkeit fĂŒr die ÜberprĂŒfung der Korrektheit und das schnelle Testen von Computer Vision Modellen.

Zitate und Danksagungen

Wenn du den ImageNet10-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte die Originalversion von ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Wir möchten dem ImageNet-Team unter der Leitung von Olga Russakovsky, Jia Deng und Li Fei-Fei fĂŒr die Erstellung und Pflege des ImageNet-Datensatzes danken. Der ImageNet10-Datensatz ist zwar eine kompakte Teilmenge, aber eine wertvolle Ressource fĂŒr schnelle Tests und Fehlersuche in der Forschungsgemeinschaft fĂŒr maschinelles Lernen und Computer Vision. Weitere Informationen ĂŒber den ImageNet-Datensatz und seine Schöpfer findest du auf der ImageNet-Website.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6)

Kommentare