Zum Inhalt springen

ImageNet10-Datensatz

Der ImageNet10-Datensatz ist eine kleine Untermenge der ImageNet-Datenbank, die von Ultralytics entwickelt und für CI-Tests, Sanity Checks und das schnelle Testen von Trainingspipelines konzipiert wurde. Dieser Datensatz besteht aus dem ersten Bild im Trainingssatz und dem ersten Bild aus dem Validierungssatz der ersten 10 Klassen in ImageNet. Obwohl deutlich kleiner, behält er die Struktur und Vielfalt des ursprünglichen ImageNet-Datensatzes bei.

Hauptmerkmale

  • ImageNet10 ist eine kompakte Version von ImageNet, die 20 Bilder enthält, die die ersten 10 Klassen des Originaldatensatzes repräsentieren.
  • Der Datensatz ist nach der WordNet-Hierarchie organisiert und spiegelt die Struktur des vollständigen ImageNet-Datensatzes wider.
  • Er eignet sich ideal für CI-Tests, Plausibilitätsprüfungen und schnelle Tests von Trainingspipelines in Computer Vision-Aufgaben.
  • Obwohl er nicht für Modell-Benchmarking konzipiert ist, kann er einen schnellen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells geben.

Dataset-Struktur

Der ImageNet10-Datensatz ist, ähnlich dem ursprünglichen ImageNet, mithilfe der WordNet-Hierarchie organisiert. Jede der 10 Klassen in ImageNet10 wird durch ein Synset (eine Sammlung von synonymen Begriffen) beschrieben. Die Bilder in ImageNet10 sind mit einem oder mehreren Synsets annotiert, was eine kompakte Ressource für das Testen von Modellen zur Erkennung verschiedener Objekte und ihrer Beziehungen darstellt.

Anwendungen

Der ImageNet10-Datensatz ist nützlich für schnelles Testen und Debugging von Computer-Vision-Modellen und -Pipelines. Seine geringe Größe ermöglicht schnelle Iterationen, was ihn ideal für Continuous-Integration-Tests und Plausibilitätsprüfungen macht. Er kann auch für schnelle vorläufige Tests neuer Modelle oder Änderungen an bestehenden Modellen verwendet werden, bevor man zu umfassenden Tests mit dem vollständigen ImageNet-Datensatz übergeht.

Nutzung

Um ein Deep-Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Training des Modells.

Testbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

sample_images und Anmerkungen

Der ImageNet10-Datensatz enthält eine Untermenge von Bildern aus dem ursprünglichen ImageNet-Datensatz. Diese Bilder wurden ausgewählt, um die ersten 10 Klassen im Datensatz darzustellen, und bieten einen vielfältigen und dennoch kompakten Datensatz für schnelles Testen und Evaluieren.

Datensatz- sample_images

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im ImageNet10-Datensatz und unterstreicht seine Nützlichkeit für Plausibilitätsprüfungen und schnelle Tests von Computer-Vision-Modellen.

Zitate und Danksagungen

Wenn Sie den ImageNet10-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das ursprüngliche ImageNet-Paper:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Wir möchten dem ImageNet-Team, unter der Leitung von Olga Russakovsky, Jia Deng und Li Fei-Fei, für die Erstellung und Pflege des ImageNet-Datensatzes danken. Der ImageNet10-Datensatz ist zwar eine kompakte Untermenge, aber eine wertvolle Ressource für schnelles Testen und Debugging in der Machine-Learning- und Computer-Vision-Forschungsgemeinschaft. Weitere Informationen zum ImageNet-Datensatz und seinen Erstellern finden Sie auf der ImageNet-Website.

FAQ

Was ist der ImageNet10-Datensatz und wie unterscheidet er sich vom vollständigen ImageNet-Datensatz?

Der ImageNet10-Datensatz ist eine kompakte Untermenge der ursprünglichen ImageNet-Datenbank, die von Ultralytics für schnelle CI-Tests, Sanity Checks und die Evaluierung von Trainingspipelines erstellt wurde. ImageNet10 umfasst nur 20 Bilder, die das erste Bild in den Trainings- und Validierungssätzen der ersten 10 Klassen in ImageNet darstellen. Trotz seiner geringen Größe behält er die Struktur und Vielfalt des vollständigen Datensatzes bei, was ihn ideal für schnelle Tests, aber nicht für das Benchmarking von Modellen macht.

Wie kann ich den ImageNet10-Datensatz verwenden, um mein Deep-Learning-Modell zu testen?

Um Ihr Deep-Learning-Modell auf dem ImageNet10-Datensatz mit einer Bildgröße von 224x224 zu testen, verwenden Sie die folgenden Code-Snippets.

Testbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite.

Warum sollte ich den ImageNet10-Datensatz für CI-Tests und Plausibilitätsprüfungen verwenden?

Der ImageNet10-Datensatz ist speziell für CI-Tests, Plausibilitätsprüfungen und schnelle Evaluierungen in Deep-Learning-Pipelines konzipiert. Seine geringe Größe ermöglicht schnelle Iterationen und Tests, was ihn perfekt für Continuous-Integration-Prozesse macht, bei denen Geschwindigkeit entscheidend ist. Durch die Beibehaltung der strukturellen Komplexität und Vielfalt des ursprünglichen ImageNet-Datensatzes bietet ImageNet10 einen zuverlässigen Hinweis auf die grundlegende Funktionalität und Korrektheit eines Modells ohne den Mehraufwand der Verarbeitung eines großen Datensatzes.

Was sind die Hauptmerkmale des ImageNet10-Datensatzes?

Der ImageNet10-Datensatz hat mehrere Hauptmerkmale:

  • Kompakte Größe: Mit nur 20 Bildern ermöglicht er schnelles Testen und Debuggen.
  • Strukturierte Organisation: Folgt der WordNet-Hierarchie, ähnlich dem vollständigen ImageNet-Datensatz.
  • CI und Sanity Checks: Ideal geeignet für Continuous Integration Tests und Sanity Checks.
  • Nicht für Benchmarking: Obwohl es für schnelle Modellbewertungen nützlich ist, ist es nicht für umfangreiches Benchmarking konzipiert.

Wie schneidet ImageNet10 im Vergleich zu anderen kleinen Datensätzen wie ImageNette ab?

Obwohl sowohl ImageNet10 als auch ImageNette Teilmengen von ImageNet sind, dienen sie unterschiedlichen Zwecken. ImageNet10 enthält lediglich 20 Bilder (2 pro Klasse) aus den ersten 10 Klassen von ImageNet, wodurch es extrem leichtgewichtig für CI-Tests und schnelle Plausibilitätsprüfungen ist. Im Gegensatz dazu enthält ImageNette Tausende von Bildern aus 10 leicht unterscheidbaren Klassen, was es besser für das eigentliche Modelltraining und die Entwicklung geeignet macht. ImageNet10 ist für die Überprüfung der Pipeline-Funktionalität konzipiert, während ImageNette besser für aussagekräftige, aber schnellere als vollständige ImageNet-Trainings-Experimente geeignet ist.



📅 Erstellt vor 2 Jahren ✏️ Aktualisiert vor 9 Monaten
glenn-jocherUltralyticsAssistantMatthewNoyceRizwanMunawarjk4e

Kommentare