Zum Inhalt springen

Tiger-Pose-Datensatz

EinfĂŒhrung

Ultralytics stellt den Tiger-Pose-Datensatz vor, eine vielseitige Sammlung, die fĂŒr PosenschĂ€tzungsaufgaben entwickelt wurde. Dieser Datensatz umfasst 263 Bilder aus einem YouTube-Video, von denen 210 Bilder fĂŒr das Training und 53 fĂŒr die Validierung verwendet werden. Er ist eine hervorragende Ressource zum Testen und zur Fehlersuche bei Algorithmen zur PosenschĂ€tzung.

Trotz seiner ĂŒberschaubaren GrĂ¶ĂŸe von 210 Bildern bietet der Tiger-Pose-Datensatz eine große Vielfalt. Er eignet sich daher zur Bewertung von Trainingspipelines, zur Identifizierung potenzieller Fehler und als wertvolle Vorstufe zur Arbeit mit grĂ¶ĂŸeren DatensĂ€tzen fĂŒr die PosenschĂ€tzung.

Dieser Datensatz ist fĂŒr die Verwendung mit Ultralytics HUB und YOLOv8.



Pass auf: Trainiere das YOLOv8 Posenmodell mit dem Tiger-Posen-Datensatz Ultralytics HUB

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) dient dazu, die Konfigurationsdetails eines Datensatzes festzulegen. Sie enthĂ€lt wichtige Daten wie Dateipfade, Klassendefinitionen und andere relevante Informationen. Speziell fĂŒr die tiger-pose.yaml Datei, kannst du prĂŒfen Ultralytics Tiger-Pose Datensatz Konfigurationsdatei.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

Verwendung

Um ein YOLOv8n-pose-Modell auf dem Tiger-Pose-Datensatz fĂŒr 100 Epochen mit einer BildgrĂ¶ĂŸe von 640 zu trainieren, kannst du die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfĂŒgbaren Argumente findest du auf der Seite Modelltraining.

Beispiel fĂŒr einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

Beispielbilder und Anmerkungen

Hier sind einige Beispiele von Bildern aus dem Tiger-Pose-Datensatz, zusammen mit den entsprechenden Anmerkungen:

Datensatz Beispielbild

  • Mosaikbild: Dieses Bild zeigt einen Trainingsstapel, der aus Mosaikbildern des Datensatzes besteht. Beim Mosaikieren werden wĂ€hrend des Trainings mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen in jedem Trainingsstapel zu erhöhen. Dadurch wird die FĂ€higkeit des Modells verbessert, sich auf unterschiedliche ObjektgrĂ¶ĂŸen, SeitenverhĂ€ltnisse und Kontexte einzustellen.

Das Beispiel zeigt die Vielfalt und KomplexitÀt der Bilder im Tiger-Pose-Datensatz und die Vorteile der Mosaikbildung im Trainingsprozess.

Beispiel fĂŒr eine Schlussfolgerung

Beispiel fĂŒr eine Schlussfolgerung

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0 Lizenz veröffentlicht.



Erstellt am 2023-11-12, Aktualisiert am 2024-02-03
Autoren: glenn-jocher (5), RizwanMunawar (1)

Kommentare