Zum Inhalt springen

ImageNet10-Datensatz

Der ImageNet10-Datensatz ist eine kleine Teilmenge der ImageNet-Datenbank, entwickelt von Ultralytics entwickelt wurde und für CI-Tests, Plausibilitätsprüfungen und schnelle Tests von Trainingspipelines gedacht ist. Dieser Datensatz besteht aus dem ersten Bild im Trainingssatz und dem ersten Bild aus dem Validierungssatz der ersten 10 Klassen in ImageNet. Obwohl er deutlich kleiner ist, behält er die Struktur und Vielfalt des ursprünglichen ImageNet-Datensatzes bei.

Wesentliche Merkmale

  • ImageNet10 ist eine kompakte Version von ImageNet, mit 20 Bildern, die die ersten 10 Klassen des Originaldatensatzes repräsentieren.
  • Der Datensatz ist entsprechend der WordNet-Hierarchie organisiert und spiegelt die Struktur des vollständigen ImageNet-Datensatzes wider.
  • Es eignet sich ideal für CI-Tests, Plausibilitätsprüfungen und das schnelle Testen von Trainings-Pipelines bei Computer-Vision-Aufgaben.
  • Obwohl es nicht für das Benchmarking von Modellen konzipiert ist, kann es einen schnellen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells geben.

Struktur des Datensatzes

Der ImageNet10-Datensatz ist, wie das ursprüngliche ImageNet, anhand der WordNet-Hierarchie organisiert. Jede der 10 Klassen in ImageNet10 wird durch ein Synset (eine Sammlung von synonymen Begriffen) beschrieben. Die Bilder in ImageNet10 sind mit einem oder mehreren Synsets annotiert und stellen eine kompakte Ressource zum Testen von Modellen zur Erkennung verschiedener Objekte und ihrer Beziehungen dar.

Anwendungen

Der ImageNet10-Datensatz eignet sich für das schnelle Testen und Debuggen von Computer-Vision-Modellen und -Pipelines. Seine geringe Größe ermöglicht eine schnelle Iteration, wodurch er sich ideal für kontinuierliche Integrationstests und Plausibilitätsprüfungen eignet. Er kann auch für schnelle Vorabtests neuer Modelle oder Änderungen an bestehenden Modellen verwendet werden, bevor mit dem vollständigen ImageNet-Datensatz getestet wird.

Verwendung

Um ein Deep Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Test Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Beispielbilder und -kommentare

Der ImageNet10-Datensatz enthält eine Teilmenge von Bildern aus dem ursprünglichen ImageNet-Datensatz. Diese Bilder wurden so ausgewählt, dass sie die ersten 10 Klassen des Datensatzes repräsentieren und so einen vielfältigen und dennoch kompakten Datensatz für schnelle Tests und Bewertungen bieten.

Datensatz Beispielbilder Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im ImageNet10-Datensatz und unterstreicht dessen Nützlichkeit für die Überprüfung der Korrektheit und das schnelle Testen von Computer-Vision-Modellen.

Zitate und Danksagungen

Wenn Sie den ImageNet10-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das ImageNet-Originaldokument:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Wir möchten dem ImageNet-Team unter der Leitung von Olga Russakovsky, Jia Deng und Li Fei-Fei für die Erstellung und Pflege des ImageNet-Datensatzes unseren Dank aussprechen. Der ImageNet10-Datensatz ist zwar eine kompakte Teilmenge, aber eine wertvolle Ressource für schnelle Tests und Fehlersuche in der Forschungsgemeinschaft für maschinelles Lernen und Computer Vision. Weitere Informationen über den ImageNet-Datensatz und seine Ersteller finden Sie auf der ImageNet-Website.

FAQ

Was ist der ImageNet10-Datensatz und wie unterscheidet er sich von dem vollständigen ImageNet-Datensatz?

Der ImageNet10-Datensatz ist eine kompakte Teilmenge der ursprünglichen ImageNet-Datenbank, die von Ultralytics für schnelle CI-Tests, Integritätsprüfungen und Evaluierungen der Trainingspipeline erstellt wurde. ImageNet10 umfasst nur 20 Bilder, die das erste Bild in den Trainings- und Validierungssätzen der ersten 10 Klassen in ImageNet darstellen. Trotz seiner geringen Größe behält es die Struktur und Vielfalt des vollständigen Datensatzes bei, wodurch es sich ideal für schnelle Tests, aber nicht für das Benchmarking von Modellen eignet.

Wie kann ich den ImageNet10-Datensatz verwenden, um mein Deep Learning-Modell zu testen?

Um Ihr Deep Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, verwenden Sie die folgenden Codeschnipsel.

Test Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Ausbildung.

Warum sollte ich den ImageNet10-Datensatz für CI-Tests und Plausibilitätsprüfungen verwenden?

Der ImageNet10-Datensatz wurde speziell für CI-Tests, Plausibilitätsprüfungen und schnelle Evaluierungen in Deep-Learning-Pipelines entwickelt. Seine geringe Größe ermöglicht schnelle Iterationen und Tests und ist damit perfekt für kontinuierliche Integrationsprozesse geeignet, bei denen Geschwindigkeit entscheidend ist. Durch die Beibehaltung der strukturellen Komplexität und Vielfalt des ursprünglichen ImageNet-Datensatzes liefert ImageNet10 einen zuverlässigen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells, ohne dass der Aufwand für die Verarbeitung eines großen Datensatzes entsteht.

Was sind die wichtigsten Merkmale des ImageNet10-Datensatzes?

Der ImageNet10-Datensatz weist mehrere wichtige Merkmale auf:

  • Kompakte Größe: Mit nur 20 Bildern ermöglicht es eine schnelle Prüfung und Fehlersuche.
  • Strukturierte Organisation: Folgt der WordNet-Hierarchie, ähnlich wie der vollständige ImageNet-Datensatz.
  • CI und Sanity Checks: Ideal geeignet für kontinuierliche Integrationstests und Sanity Checks.
  • Nicht für Benchmarking: Es ist zwar für schnelle Modellevaluierungen nützlich, aber nicht für ein umfassendes Benchmarking gedacht.

Wo kann ich den ImageNet10-Datensatz herunterladen?

Sie können den ImageNet10-Datensatz von der SeiteUltralytics GitHub releases herunterladen. Ausführlichere Informationen über seine Struktur und Anwendungen finden Sie auf der Seite ImageNet10 Dataset.

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 2 Monaten

Kommentare