Zum Inhalt springen

ImageNet-Datensatz

ImageNet ist eine groß angelegte Datenbank mit kommentierten Bildern, die fĂŒr die Forschung zur visuellen Objekterkennung entwickelt wurde. Sie enthĂ€lt ĂŒber 14 Millionen Bilder, wobei jedes Bild mit WordNet-Synsets kommentiert ist. Damit ist sie eine der umfangreichsten Ressourcen, die fĂŒr das Training von Deep-Learning-Modellen fĂŒr Computer-Vision-Aufgaben zur VerfĂŒgung stehen.

Hauptmerkmale

  • ImageNet enthĂ€lt ĂŒber 14 Millionen hochauflösende Bilder, die Tausende von Objektkategorien abdecken.
  • Der Datensatz ist entsprechend der WordNet-Hierarchie organisiert, wobei jedes Synset eine Kategorie darstellt.
  • ImageNet wird hĂ€ufig fĂŒr das Training und Benchmarking im Bereich Computer Vision verwendet, insbesondere fĂŒr Bildklassifizierungs- und Objekterkennungsaufgaben.
  • Die jĂ€hrliche ImageNet Large Scale Visual Recognition Challenge (ILSVRC) hat die Bildverarbeitungsforschung entscheidend vorangebracht.

Struktur des Datensatzes

Der ImageNet-Datensatz ist mithilfe der WordNet-Hierarchie organisiert. Jeder Knoten in der Hierarchie steht fĂŒr eine Kategorie, und jede Kategorie wird durch ein Synset (eine Sammlung von synonymen Begriffen) beschrieben. Die Bilder im ImageNet sind mit einem oder mehreren Synsets versehen und bieten so eine reichhaltige Ressource fĂŒr das Training von Modellen zur Erkennung verschiedener Objekte und ihrer Beziehungen.

ImageNet Large Scale Visual Recognition Challenge (ILSVRC)

Die jĂ€hrlich stattfindende ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ist ein wichtiges Ereignis auf dem Gebiet der Computer Vision. Sie bietet Forschern und Entwicklern eine Plattform, um ihre Algorithmen und Modelle an einem großen Datensatz mit standardisierten BewertungsmaßstĂ€ben zu testen. Die ILSVRC hat zu bedeutenden Fortschritten bei der Entwicklung von Deep-Learning-Modellen fĂŒr die Bildklassifizierung, Objekterkennung und andere Computer-Vision-Aufgaben gefĂŒhrt.

Anwendungen

Der ImageNet-Datensatz wird hĂ€ufig zum Trainieren und Evaluieren von Deep-Learning-Modellen fĂŒr verschiedene Computer-Vision-Aufgaben wie Bildklassifizierung, Objekterkennung und Objektlokalisierung verwendet. Einige beliebte Deep-Learning-Architekturen wie AlexNet, VGG und ResNet wurden entwickelt und mit dem ImageNet-Datensatz verglichen.

Verwendung

Um ein Deep Learning-Modell auf dem ImageNet-Datensatz fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 224x224 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

Beispielbilder und Anmerkungen

Der ImageNet-Datensatz enthĂ€lt hochaufgelöste Bilder aus Tausenden von Objektkategorien und ist ein vielfĂ€ltiger und umfangreicher Datensatz zum Trainieren und Evaluieren von Computer-Vision-Modellen. Hier sind einige Beispiele fĂŒr Bilder aus dem Datensatz:

Datensatz Beispielbilder

Das Beispiel zeigt die Vielfalt und KomplexitĂ€t der Bilder im ImageNet-Datensatz und verdeutlicht, wie wichtig ein vielfĂ€ltiger Datensatz fĂŒr das Training robuster Computer Vision Modelle ist.

Zitate und Danksagungen

Wenn du den ImageNet-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Dokument:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Wir möchten dem ImageNet-Team unter der Leitung von Olga Russakovsky, Jia Deng und Li Fei-Fei dafĂŒr danken, dass sie den ImageNet-Datensatz als wertvolle Ressource fĂŒr die Forschungsgemeinschaft im Bereich des maschinellen Lernens und des Computersehens erstellt und gepflegt haben. Weitere Informationen ĂŒber den ImageNet-Datensatz und seine Schöpfer findest du auf der ImageNet-Website.



Erstellt am 2023-11-12, Aktualisiert am 2024-01-12
Autoren: glenn-jocher (4)

Kommentare