Link to this sectionImageNet-Datensatz#

Name: ImageNet Bildklassifizierungs-Datenset
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, Bildklassifizierung, Deep Learning, Computer Vision, vortrainierte Modelle, YOLO, Datensatz, WordNet

Das Ultralytics ImageNet Datenset (data="imagenet") ist das ImageNet-1k / ILSVRC-2012 Subset, das zum Trainieren und Benchmarking von Bildklassifizierungs Modellen verwendet wird. Es enthält 1.000 Objektklassen mit 1.281.167 Trainingsbildern und 50.000 Validierungsbildern bei einer Bildgröße von 224x224 und erfordert einen Download von etwa 144 GB an Daten. Die umfassendere ImageNet Datenbank ist weitaus größer – über 14 Millionen hochauflösende Bilder, die mit WordNet-Synsets über mehr als 20.000 Kategorien annotiert sind –, aber Ultralytics trainiert auf dem standardisierten 1.000-Klassen-ILSVRC-Subset, das zum De-facto-Benchmark für Deep Learning in der Computer Vision wurde.

Link to this sectionImageNet vortrainierte Modelle#

Modell	Größe ^(Pixel)	acc ^top1	acc ^top5	Geschwindigkeit ^{CPU ONNX (ms)}	Geschwindigkeit ^{T4 TensorRT10 (ms)}	Parameter ^(M)	FLOPs ^{(B) bei 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79,9	95,0	41,4 ± 0,9	3,8 ± 0,0	29,6	13,6

Link to this sectionHauptfunktionen#

Das Ultralytics imagenet Datenset bietet 1.000 Klassen mit 1.281.167 Trainings- und 50.000 Validierungsbildern (ILSVRC-2012), der Standard-Pretraining-Benchmark für Bildklassifizierung.
Die Klassen sind gemäß der WordNet-Hierarchie organisiert, wobei jede Klasse einem Synset (einer Menge synonyme Begriffe) entspricht.
Die Bilder werden bei 224x224 trainiert und das vollständige Datenset ist ein großer Download von ~144 GB.
Die jährliche ImageNet Large Scale Visual Recognition Challenge (ILSVRC) hat maßgeblich zur Förderung der Computer-Vision-Forschung beigetragen.

Link to this sectionDatensatzstruktur#

Das Ultralytics ImageNet Datenset verwendet den ILSVRC-2012 Split:

Split	Bilder	Klassen
Trainieren	1.281.167	1.000
Validation	50.000	1.000

Die Bilder sind in klassenspezifischen Ordnern gespeichert, die nach der WordNet-Synset-ID benannt sind (zum Beispiel n01440764), dem Layout, das das Ultralytics Klassifizierungstraining erwartet. Jede der 1.000 Klassen bildet ein WordNet-Synset ab, und es gibt keinen separaten Test-Split, daher wird das 50.000-Bilder-Validierungsset zur Messung der Genauigkeit verwendet.

Downloadgröße

ImageNet-1k ist ein Download von ~144 GB, stelle also sicher, dass du vor dem Training genügend Festplattenspeicher hast. Für schnelle Experimente verwenden die kleineren ImageNette und ImageNet10 Subsets dasselbe Ordnerformat und trainieren in einem Bruchteil der Zeit.

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

Die jährliche ImageNet Large Scale Visual Recognition Challenge (ILSVRC) ermöglichte es Forschern, Algorithmen auf einem groß angelegten, standardisierten Datenset mit konsistenten Bewertungsmetriken zu benchmarken. Sie trieb bedeutende Fortschritte im Deep Learning für Bildklassifizierung, Objekterkennung und andere Vision-Aufgaben voran – vor allem AlexNets Sieg im Jahr 2012, der dazu beitrug, die moderne Ära des Deep Learnings einzuleiten.

Link to this sectionAnwendungen#

Das ImageNet Datenset wird weithin verwendet, um Deep-Learning-Modelle für Bildklassifizierung, Objekterkennung und Objektlokalisierung zu trainieren und zu bewerten. Wegweisende Architekturen wie AlexNet, VGG und ResNet wurden alle auf ImageNet entwickelt und gebenchmarkt, und ImageNet-vorab trainierte Gewichte bleiben ein gängiger Ausgangspunkt für Transfer Learning über Vision-Aufgaben hinweg.

Link to this sectionVerwendung#

Um ein YOLO Klassifizierungsmodell auf ImageNet für 100 Epochen bei einer Bildgröße von 224x224 zu trainieren, verwende die untenstehenden Code-Snippets. Eine umfassende Liste der verfügbaren Argumente findest du auf der Trainings Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Du kannst Klassifizierungsdatensets auch verwalten und das Training in der Cloud mit der Ultralytics Platform durchführen.

Link to this sectionBeispielbilder und Annotationen#

Das ImageNet Datenset umfasst die 1.000 ILSVRC-2012 Klassen und bietet eine vielfältige und umfangreiche Ressource zum Trainieren und Bewerten von Computer Vision Modellen. Hier sind einige Beispielbilder aus dem Datenset:

ImageNet Klassifizierungs-Datensatz Beispielbilder

Link to this sectionZitate und Danksagungen#

Wenn du den ImageNet-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:

Zitat

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Wir möchten dem ImageNet-Team, geleitet von Olga Russakovsky, Jia Deng und Li Fei-Fei, dafür danken, dass sie den ImageNet-Datensatz als wertvolle Ressource für die Machine Learning- und Computer-Vision-Forschungsgemeinschaft erstellt und gepflegt haben. Weitere Informationen über den ImageNet-Datensatz und seine Ersteller findest du auf der ImageNet-Website.

Link to this sectionFAQ#

Link to this sectionWas ist der ImageNet-Datensatz und wie wird er in der Computer Vision eingesetzt?#

Das ImageNet Datenset ist eine groß angelegte Bilddatenbank, deren umfassendere Sammlung über 14 Millionen hochauflösende Bilder enthält, die mit WordNet-Synsets annotiert sind. Bei Ultralytics trainiert data="imagenet" auf dem standardisierten 1.000-Klassen-ILSVRC-2012 Subset, das der De-facto-Benchmark für das Pretraining zur Bildklassifizierung ist. Wegweisende Modelle wie AlexNet, VGG und ResNet wurden auf ImageNet trainiert und gebenchmarkt, was seine Rolle bei der Förderung der Computer Vision unterstreicht.

Link to this sectionWie viele Klassen und Bilder hat das ImageNet Datenset?#

Das Ultralytics imagenet Datenset verwendet das ILSVRC-2012 Subset mit 1.000 Klassen, 1.281.167 Trainingsbildern und 50.000 Validierungsbildern bei einer Bildgröße von 224x224, für einen Gesamtdownload von etwa 144 GB. Die vollständige ImageNet Datenbank ist viel größer (über 14 Millionen Bilder über mehr als 20.000 WordNet-Synsets), aber das 1.000-Klassen-Subset ist dasjenige, das für das Klassifizierungstraining und Benchmarking verwendet wird.

Link to this sectionWie kann ich ein YOLO Modell zur Bildklassifizierung auf dem ImageNet Datenset trainieren?#

Um ein Ultralytics YOLO Modell auf ImageNet zu trainieren, lade ein vortrainiertes Klassifizierungsmodell und verweise data auf imagenet:

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Für detailliertere Trainingsanweisungen lies unsere Training-Seite.

Link to this sectionWarum sollte ich die vortrainierten Ultralytics YOLO26-Modelle für meine ImageNet-Datensatzprojekte verwenden?#

Vortrainierte Ultralytics YOLO26-Modelle bieten modernste Leistung in Bezug auf Geschwindigkeit und Genauigkeit für verschiedene Computer-Vision-Aufgaben. Zum Beispiel ist das YOLO26n-cls-Modell mit einer Top-1-Genauigkeit von 71,4% und einer Top-5-Genauigkeit von 90,1% für Echtzeitanwendungen optimiert. Vortrainierte Modelle reduzieren den Rechenaufwand für das Training von Grund auf und beschleunigen Entwicklungszyklen. Erfahre mehr über die Leistungsmetriken der YOLO26-Modelle im Abschnitt Vortrainierte ImageNet-Modelle.

Link to this sectionWelche Rolle spielt die ImageNet Large Scale Visual Recognition Challenge (ILSVRC) in der Computer Vision?#

Die jährliche ImageNet Large Scale Visual Recognition Challenge (ILSVRC) trieb Fortschritte in der Computer Vision voran, indem sie eine wettbewerbsfähige Plattform zur Bewertung von Algorithmen auf einem groß angelegten, standardisierten Datenset bot. Ihre konsistenten Bewertungsmetriken förderten Innovationen in der Bildklassifizierung, Objekterkennung und Bildsegmentierung und verschoben kontinuierlich die Grenzen des Deep Learnings und der Computer Vision.

Mitwirkende

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

Erstellt 12. Nov. 2023Aktualisiert vor 3 Tagen