Zum Inhalt springen

├ťbersicht ├╝ber die Bildklassifizierungsdatens├Ątze

Datensatzstruktur f├╝r YOLO Klassifizierungsaufgaben

F├╝r Ultralytics YOLO Klassifizierungsaufgaben muss der Datensatz in einer bestimmten Split-Direcotry-Struktur unter der root Verzeichnis, um die Schulung, die Pr├╝fung und den optionalen Validierungsprozess zu erleichtern. Diese Struktur umfasst separate Verzeichnisse f├╝r die Ausbildung (train) und Pr├╝fung (test), mit einem optionalen Verzeichnis zur Validierung (val).

Jedes dieser Verzeichnisse sollte ein Unterverzeichnis f├╝r jede Klasse des Datensatzes enthalten. Die Unterverzeichnisse werden nach der entsprechenden Klasse benannt und enthalten alle Bilder f├╝r diese Klasse. Achte darauf, dass jede Bilddatei einen eindeutigen Namen hat und in einem g├Ąngigen Format wie JPEG oder PNG gespeichert ist.

Beispiel f├╝r eine Ordnerstruktur

Nimm den CIFAR-10-Datensatz als Beispiel. Die Ordnerstruktur sollte wie folgt aussehen:

cifar-10-/
|
|-- train/
|   |-- airplane/
|   |   |-- 10008_airplane.png
|   |   |-- 10009_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 1000_automobile.png
|   |   |-- 1001_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 10014_bird.png
|   |   |-- 10015_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- test/
|   |-- airplane/
|   |   |-- 10_airplane.png
|   |   |-- 11_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 100_automobile.png
|   |   |-- 101_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1000_bird.png
|   |   |-- 1001_bird.png
|   |   |-- ...
|   |
|   |-- ...
|
|-- val/ (optional)
|   |-- airplane/
|   |   |-- 105_airplane.png
|   |   |-- 106_airplane.png
|   |   |-- ...
|   |
|   |-- automobile/
|   |   |-- 102_automobile.png
|   |   |-- 103_automobile.png
|   |   |-- ...
|   |
|   |-- bird/
|   |   |-- 1045_bird.png
|   |   |-- 1046_bird.png
|   |   |-- ...
|   |
|   |-- ...

Dieser strukturierte Ansatz stellt sicher, dass das Modell in der Trainingsphase effektiv von gut organisierten Klassen lernen und die Leistung in der Test- und Validierungsphase genau bewerten kann.

Verwendung

Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="path/to/dataset", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=path/to/data model=yolov8n-cls.pt epochs=100 imgsz=640

Unterst├╝tzte Datens├Ątze

Ultralytics unterst├╝tzt die folgenden Datens├Ątze mit automatischem Download:

  • Caltech 101: Ein Datensatz mit Bildern von 101 Objektkategorien f├╝r Bildklassifizierungsaufgaben.
  • Caltech 256: Eine erweiterte Version von Caltech 101 mit 256 Objektkategorien und noch anspruchsvolleren Bildern.
  • CIFAR-10: Ein Datensatz mit 60K 32x32 Farbbildern in 10 Klassen, mit 6K Bildern pro Klasse.
  • CIFAR-100: Eine erweiterte Version von CIFAR-10 mit 100 Objektkategorien und 600 Bildern pro Klasse.
  • Fashion-MNIST: Ein Datensatz bestehend aus 70.000 Graustufenbildern von 10 Modekategorien f├╝r Bildklassifizierungsaufgaben.
  • ImageNet: Ein gro├čer Datensatz zur Objekterkennung und Bildklassifizierung mit ├╝ber 14 Millionen Bildern und 20.000 Kategorien.
  • ImageNet-10: Eine kleinere Teilmenge von ImageNet mit 10 Kategorien zum schnelleren Experimentieren und Testen.
  • Imagenette: Eine kleinere Teilmenge von ImageNet, die 10 leicht unterscheidbare Klassen enth├Ąlt, um das Training und Testen zu beschleunigen.
  • Imagewoof: Eine anspruchsvollere Teilmenge von ImageNet mit 10 Hunderassenkategorien f├╝r Bildklassifizierungsaufgaben.
  • MNIST: Ein Datensatz mit 70.000 Graustufenbildern von handgeschriebenen Ziffern f├╝r Bildklassifizierungsaufgaben.

Hinzuf├╝gen deines eigenen Datensatzes

Wenn du deinen eigenen Datensatz hast und ihn f├╝r das Training von Klassifizierungsmodellen mit Ultralytics verwenden m├Âchtest, stelle sicher, dass er dem oben unter "Datensatzformat" angegebenen Format entspricht, und zeige dann deine data Argument auf das Verzeichnis des Datensatzes.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (6), stormsson (1), GreatV (1)

Kommentare