Zum Inhalt springen

├ťbersicht ├╝ber die Bildklassifizierungsdatens├Ątze

Format des Datensatzes

Die Ordnerstruktur f├╝r Klassifizierungsdatens├Ątze in torchvision folgt normalerweise einem Standardformat:

root/
|-- class1/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class2/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- class3/
|   |-- img1.jpg
|   |-- img2.jpg
|   |-- ...
|
|-- ...

In dieser Ordnerstruktur werden die root Verzeichnis enth├Ąlt ein Unterverzeichnis f├╝r jede Klasse im Datensatz. Jedes Unterverzeichnis ist nach der entsprechenden Klasse benannt und enth├Ąlt alle Bilder f├╝r diese Klasse. Jede Bilddatei hat einen eindeutigen Namen und ist in der Regel in einem g├Ąngigen Bildformat wie JPEG oder PNG.

** Beispiel **

Im CIFAR10-Datensatz w├╝rde die Ordnerstruktur zum Beispiel wie folgt aussehen:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...

In diesem Beispiel wird die train enth├Ąlt Unterverzeichnisse f├╝r jede Klasse im Datensatz, und jedes Unterverzeichnis enth├Ąlt alle Bilder f├╝r diese Klasse. Die test Verzeichnis hat eine ├Ąhnliche Struktur. Die root Verzeichnis enth├Ąlt auch andere Dateien, die Teil des CIFAR10-Datensatzes sind.

Verwendung

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='path/to/dataset', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

Unterst├╝tzte Datens├Ątze

Ultralytics unterst├╝tzt die folgenden Datens├Ątze mit automatischem Download:

  • Caltech 101: Ein Datensatz mit Bildern von 101 Objektkategorien f├╝r Bildklassifizierungsaufgaben.
  • Caltech 256: Eine erweiterte Version von Caltech 101 mit 256 Objektkategorien und noch anspruchsvolleren Bildern.
  • CIFAR-10: Ein Datensatz mit 60K 32x32 Farbbildern in 10 Klassen, mit 6K Bildern pro Klasse.
  • CIFAR-100: Eine erweiterte Version von CIFAR-10 mit 100 Objektkategorien und 600 Bildern pro Klasse.
  • Fashion-MNIST: Ein Datensatz bestehend aus 70.000 Graustufenbildern von 10 Modekategorien f├╝r Bildklassifizierungsaufgaben.
  • ImageNet: Ein gro├čer Datensatz zur Objekterkennung und Bildklassifizierung mit ├╝ber 14 Millionen Bildern und 20.000 Kategorien.
  • ImageNet-10: Eine kleinere Teilmenge von ImageNet mit 10 Kategorien zum schnelleren Experimentieren und Testen.
  • Imagenette: Eine kleinere Teilmenge von ImageNet, die 10 leicht unterscheidbare Klassen enth├Ąlt, um das Training und Testen zu beschleunigen.
  • Imagewoof: Eine anspruchsvollere Teilmenge von ImageNet mit 10 Hunderassenkategorien f├╝r Bildklassifizierungsaufgaben.
  • MNIST: Ein Datensatz mit 70.000 Graustufenbildern von handgeschriebenen Ziffern f├╝r Bildklassifizierungsaufgaben.

Hinzuf├╝gen deines eigenen Datensatzes

Wenn du deinen eigenen Datensatz hast und ihn f├╝r das Training von Klassifizierungsmodellen mit Ultralytics verwenden m├Âchtest, stelle sicher, dass er dem oben unter "Datensatzformat" angegebenen Format entspricht, und zeige dann deine data Argument auf das Verzeichnis des Datensatzes.



Erstellt am 2023-11-12, Aktualisiert am 2024-01-07
Autoren: glenn-jocher (4), GreatV (1)

Kommentare