ImageNet10-Datensatz
Der ImageNet10-Datensatz ist eine kleinformatige Untergruppe der ImageNet-Datenbank, die von Ultralytics entwickelt wurde und für CI-Tests, Plausibilitätsprüfungen und schnelle Tests von Trainings-Pipelines konzipiert ist. Dieser Datensatz besteht aus dem jeweils ersten Bild des Trainings-Sets und dem ersten Bild des Validierungs-Sets der ersten 10 Klassen von ImageNet. Obwohl er deutlich kleiner ist, behält er die Struktur und Vielfalt des ursprünglichen ImageNet-Datensatzes bei.
Hauptmerkmale
- ImageNet10 ist eine kompakte Version von ImageNet mit 20 Bildern, die die ersten 10 Klassen des ursprünglichen Datensatzes repräsentieren.
- Der Datensatz ist gemäß der WordNet-Hierarchie organisiert und spiegelt die Struktur des vollständigen ImageNet-Datensatzes wider.
- Er eignet sich ideal für CI-Tests, Plausibilitätsprüfungen und schnelle Tests von Trainings-Pipelines bei Computer Vision-Aufgaben.
- Obwohl er nicht für Modell-Benchmarking ausgelegt ist, kann er einen schnellen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells liefern.
Datensatzstruktur
Der ImageNet10-Datensatz ist, wie das ursprüngliche ImageNet, mithilfe der WordNet-Hierarchie organisiert. Jede der 10 Klassen in ImageNet10 wird durch ein Synset (eine Sammlung synonymer Begriffe) beschrieben. Die Bilder in ImageNet10 sind mit einem oder mehreren Synsets annotiert, was eine kompakte Ressource zum Testen von Modellen bei der Erkennung verschiedener Objekte und deren Beziehungen bietet.
Anwendungen
Der ImageNet10-Datensatz ist nützlich für das schnelle Testen und Debuggen von Computer-Vision-Modellen und -Pipelines. Seine geringe Größe ermöglicht eine schnelle Iteration, was ihn ideal für Continuous Integration-Tests und Plausibilitätsprüfungen macht. Er kann auch für schnelle Vorabtests neuer Modelle oder Änderungen an bestehenden Modellen verwendet werden, bevor du zu vollständigen Tests mit dem kompletten ImageNet-Datensatz übergehst.
Verwendung
Um ein Deep-Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Beispielbilder und Annotationen
Der ImageNet10-Datensatz enthält eine Teilmenge von Bildern aus dem ursprünglichen ImageNet-Datensatz. Diese Bilder wurden ausgewählt, um die ersten 10 Klassen im Datensatz zu repräsentieren, was einen vielfältigen und dennoch kompakten Datensatz für schnelle Tests und Bewertungen bietet.

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im ImageNet10-Datensatz und unterstreicht seinen Nutzen für Plausibilitätsprüfungen und schnelle Tests von Computer-Vision-Modellen.
Zitate und Danksagungen
Wenn du den ImageNet10-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das ursprüngliche ImageNet-Paper:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Wir möchten dem ImageNet-Team unter der Leitung von Olga Russakovsky, Jia Deng und Li Fei-Fei für die Erstellung und Pflege des ImageNet-Datensatzes danken. Der ImageNet10-Datensatz ist, obwohl er eine kompakte Teilmenge darstellt, eine wertvolle Ressource für schnelle Tests und Debugging in der Machine Learning- und Computer-Vision-Forschungsgemeinschaft. Weitere Informationen über den ImageNet-Datensatz und seine Ersteller findest du auf der ImageNet-Website.
FAQ
Was ist der ImageNet10-Datensatz und wie unterscheidet er sich vom vollständigen ImageNet-Datensatz?
Der ImageNet10-Datensatz ist eine kompakte Teilmenge der ursprünglichen ImageNet-Datenbank, die von Ultralytics für schnelle CI-Tests, Plausibilitätsprüfungen und die Evaluierung von Trainings-Pipelines erstellt wurde. ImageNet10 umfasst nur 20 Bilder, die das jeweils erste Bild der Trainings- und Validierungs-Sets der ersten 10 Klassen in ImageNet repräsentieren. Trotz seiner geringen Größe behält er die Struktur und Vielfalt des vollständigen Datensatzes bei, was ihn ideal für schnelle Tests macht, jedoch nicht für das Benchmarking von Modellen.
Wie kann ich den ImageNet10-Datensatz verwenden, um mein Deep-Learning-Modell zu testen?
Um dein Deep-Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, verwende die folgenden Code-Snippets.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Siehe die Training-Seite für eine umfassende Liste der verfügbaren Argumente.
Warum sollte ich den ImageNet10-Datensatz für CI-Tests und Plausibilitätsprüfungen verwenden?
Der ImageNet10-Datensatz wurde speziell für CI-Tests, Plausibilitätsprüfungen und schnelle Evaluierungen in Deep Learning-Pipelines entwickelt. Seine geringe Größe ermöglicht schnelle Iterationen und Tests, was ihn perfekt für Continuous-Integration-Prozesse macht, bei denen Geschwindigkeit entscheidend ist. Durch die Beibehaltung der strukturellen Komplexität und Vielfalt des ursprünglichen ImageNet-Datensatzes bietet ImageNet10 einen zuverlässigen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells ohne den Mehraufwand für die Verarbeitung eines großen Datensatzes.
Was sind die Hauptmerkmale des ImageNet10-Datensatzes?
Der ImageNet10-Datensatz hat mehrere Hauptmerkmale:
- Kompakte Größe: Mit nur 20 Bildern ermöglicht er schnelle Tests und Debugging.
- Strukturierte Organisation: Folgt der WordNet-Hierarchie, ähnlich wie der vollständige ImageNet-Datensatz.
- CI- und Plausibilitätsprüfungen: Ideal geeignet für Continuous-Integration-Tests und Plausibilitätsprüfungen.
- Nicht für Benchmarking: Obwohl nützlich für schnelle Modell-Evaluierungen, ist er nicht für umfangreiches Benchmarking konzipiert.
Wie schneidet ImageNet10 im Vergleich zu anderen kleinen Datensätzen wie ImageNette ab?
Während sowohl ImageNet10 als auch ImageNette Teilmengen von ImageNet sind, dienen sie unterschiedlichen Zwecken. ImageNet10 enthält nur 20 Bilder (2 pro Klasse) aus den ersten 10 Klassen von ImageNet, was ihn extrem leichtgewichtig für CI-Tests und schnelle Plausibilitätsprüfungen macht. Im Gegensatz dazu enthält ImageNette tausende Bilder über 10 leicht unterscheidbare Klassen hinweg, was ihn besser für das tatsächliche Modelltraining und die Entwicklung geeignet macht. ImageNet10 ist für die Überprüfung der Pipeline-Funktionalität konzipiert, während ImageNette besser für aussagekräftige, aber schnellere Trainingsexperimente als mit dem vollständigen ImageNet geeignet ist.