Link to this sectionTiger-Pose Datensatz#

Name: Tiger-Pose Estimation Dataset
Creator: Ultralytics
License: https://www.ultralytics.com/license
Keywords: Ultralytics, Tiger-Pose, Datensatz, pose estimation, YOLO26, Trainingsdaten, Maschinelles Lernen, neuronale Netzwerke

Link to this sectionEinführung#

Ultralytics stellt den Tiger-Pose Datensatz vor, eine vielseitige Sammlung für Aufgaben der Posen-Schätzung. Dieser Datensatz umfasst 263 Bilder aus einem YouTube-Video, wobei 210 Bilder für das Training und 53 für die Validierung vorgesehen sind. Er dient als hervorragende Ressource zum Testen und zur Fehlerbehebung von Algorithmen zur Posen-Schätzung.

Trotz seines überschaubaren Trainingsdatensatzes von 210 Bildern bietet der Tiger-Pose-Datensatz Vielfalt und eignet sich daher hervorragend zur Bewertung von Trainings-Pipelines, zur Identifizierung potenzieller Fehler sowie als wertvoller vorbereitender Schritt, bevor du mit größeren Datensätzen für die Pose Estimation arbeitest.

Sobald deine Pipeline mit diesem kleinen Datensatz sauber trainiert, kannst du deine eigenen Tier- oder Objekt-Keypoints verwenden und das Training auf der Ultralytics Platform skalieren, ohne den Browser verlassen zu müssen.

Link to this sectionDatensatzstruktur#

Gesamtzahl der Bilder: 263 (210 train / 53 val).
Keypoints: 12 pro Tiger (kein Sichtbarkeits-Flag).
Download-Größe: ~49,8 MB.
Verzeichnisstruktur: YOLO-Format Keypoints gespeichert unter labels/{train,val} neben images/{train,val} Verzeichnissen.

Watch: Train an Ultralytics YOLO Pose Model on the Tiger-Pose Dataset

Link to this sectionDatensatz-YAML#

Eine YAML-Datei dient dazu, die Konfigurationsdetails eines Datensatzes festzulegen. Sie umfasst wichtige Daten wie Dateipfade, Klassendefinitionen und andere relevante Informationen. Für die Datei tiger-pose.yaml kannst du dir speziell die Ultralytics Tiger-Pose Dataset Configuration File ansehen.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Link to this sectionVerwendung#

Um ein YOLO26n-pose Modell auf dem Tiger-Pose Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Training.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

Link to this sectionBeispielbilder und Annotationen#

Hier sind einige Beispiele für Bilder aus dem Tiger-Pose Datensatz zusammen mit ihren entsprechenden Annotationen:

Tiger pose estimation dataset mosaic training batch

Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatz-Bildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Bilder im Tiger-Pose Datensatz sowie die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Link to this sectionInferenz-Beispiel#

Lade nach dem Training deinen besten Checkpoint und führe die Inferenz auf neuen Bildern oder Videos durch – die vollständige Liste der Argumente findest du auf der Seite Prediction.

Inferenz-Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

Link to this sectionZitate und Danksagungen#

Ultralytics veröffentlicht die Tiger-Pose-Datensatzannotationen unter der AGPL-3.0 License. Das Quellvideo unterliegt weiterhin seinen ursprünglichen Bedingungen, die vor der Verwendung oder Weitergabe der extrahierten Frames überprüft werden sollten.

Link to this sectionFAQ#

Link to this sectionWofür wird der Ultralytics Tiger-Pose Datensatz verwendet?#

Das Ultralytics Tiger-Pose Dataset wurde für Pose-Estimation-Aufgaben entwickelt und besteht aus 263 Bildern, die aus einem YouTube-Video stammen. Der Datensatz ist in 210 Trainingsbilder und 53 Validierungsbilder unterteilt und eignet sich daher hervorragend zum Testen, Trainieren und Verfeinern von Pose-Estimation-Algorithmen.

Link to this sectionWie trainiere ich ein YOLO26 Modell auf dem Tiger-Pose Datensatz?#

Lade yolo26n-pose.pt und rufe model.train(data="tiger-pose.yaml", epochs=100, imgsz=640) auf – siehe das Train Example oben für die vollständigen Python- und CLI-Snippets sowie die Seite Training für eine umfassende Liste der Argumente.

Link to this sectionWelche Konfigurationen enthält die `tiger-pose.yaml` Datei?#

Die Datei tiger-pose.yaml definiert den Datensatzpfad, die Verzeichnisse für Trainings- und Validierungsbilder, eine einzelne Klasse (tiger) und kpt_shape: [12, 2] – 12 Keypoints pro Instanz ohne Sichtbarkeits-Flag. Siehe die Ultralytics Tiger-Pose Dataset Configuration File für die genaue Konfiguration.

Link to this sectionWie kann ich die Inferenz mit einem auf dem Tiger-Pose Datensatz trainierten YOLO26 Modell durchführen?#

Lade deinen trainierten Checkpoint (z. B. path/to/best.pt) und rufe model.predict(source=..., show=True) auf – siehe das Inference Example oben für die vollständigen Python- und CLI-Snippets sowie die Seite Prediction für eine umfassende Liste der Argumente.

Link to this sectionWas sind die Vorteile der Verwendung des Tiger-Pose Datensatzes für die Posen-Schätzung?#

Mit insgesamt 263 Bildern (210 Training / 53 Validierung), 1 Klasse, 12 Keypoints pro Instanz und einem Download von ca. 49,8 MB ist Tiger-Pose kompakt genug für ein schnelles Handling, aber vielfältig genug, um eine Pose-Training-Pipeline auf Plausibilität zu prüfen und Fehler zu identifizieren, bevor du mit größeren Datensätzen arbeitest.

Mitwirkende

GLglenn-jocher²⁰ RAraimbekovm³ HIhim2him2¹ MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹ LUlunarifish¹

Erstellt 12. Nov. 2023Aktualisiert vor 3 Tagen