Tiger-Pose Datensatz
Einführung
Ultralytics stellt den Tiger-Pose Datensatz vor, eine vielseitige Sammlung für Aufgaben der Pose-Schätzung. Dieser Datensatz umfasst 263 Bilder, die aus einem YouTube-Video stammen, wobei 210 Bilder für das Training und 53 für die Validierung vorgesehen sind. Er dient als hervorragende Ressource zum Testen und zur Fehlerbehebung bei Algorithmen zur Pose-Schätzung.
Trotz des überschaubaren Trainings-Splits von 210 Bildern bietet der Tiger-Pose Datensatz eine hohe Vielfalt. Dies macht ihn geeignet für die Bewertung von Trainings-Pipelines, das Identifizieren potenzieller Fehler und als wertvollen ersten Schritt, bevor man mit größeren Datensätzen für die Pose-Schätzung arbeitet.
Dieser Datensatz ist für die Verwendung mit der Ultralytics Platform und YOLO26 vorgesehen.
Datensatzstruktur
- Gesamtanzahl Bilder: 263 (210 train / 53 val).
- Keypoints: 12 pro Tiger (kein Sichtbarkeits-Flag).
- Verzeichnisstruktur: YOLO-formatierte Keypoints, gespeichert unter
labels/{train,val}neben den Verzeichnissenimages/{train,val}.
Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform
Datensatz-YAML
Eine YAML-Datei (Yet Another Markup Language) dient dazu, die Konfigurationsdetails eines Datensatzes festzulegen. Sie enthält wichtige Daten wie Dateipfade, Klassendefinitionen und andere relevante Informationen. Für die Datei tiger-pose.yaml kannst du die Ultralytics Tiger-Pose Dataset Configuration File einsehen.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Keypoint names per class
kpt_names:
0:
- nose
- head
- withers
- tail_base
- right_hind_hock
- right_hind_paw
- left_hind_paw
- left_hind_hock
- right_front_wrist
- right_front_paw
- left_front_wrist
- left_front_paw
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zipVerwendung
Um ein YOLO26n-pose Modell auf dem Tiger-Pose Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Training Seite des Modells.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Beispielbilder und Annotationen
Hier sind einige Beispiele für Bilder aus dem Tiger-Pose Datensatz zusammen mit den entsprechenden Annotationen:
- Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatzbildern besteht. Mosaiking ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im Tiger-Pose Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.
Inferenzbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Zitate und Danksagungen
Der Datensatz wurde unter der AGPL-3.0 License veröffentlicht.
FAQ
Wofür wird der Ultralytics Tiger-Pose Datensatz verwendet?
Der Ultralytics Tiger-Pose Datensatz wurde für Aufgaben der Pose-Schätzung entwickelt und besteht aus 263 Bildern, die aus einem YouTube-Video stammen. Der Datensatz ist in 210 Trainingsbilder und 53 Validierungsbilder unterteilt. Er ist besonders nützlich für das Testen, Trainieren und Verfeinern von Algorithmen zur Pose-Schätzung unter Verwendung der Ultralytics Platform und YOLO26.
Wie trainiere ich ein YOLO26 Modell auf dem Tiger-Pose Datensatz?
Um ein YOLO26n-pose Modell auf dem Tiger-Pose Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwende die folgenden Code-Snippets. Weitere Details findest du auf der Training Seite:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)Welche Konfigurationen enthält die tiger-pose.yaml Datei?
Die tiger-pose.yaml Datei wird verwendet, um die Konfigurationsdetails des Tiger-Pose Datensatzes festzulegen. Sie enthält wichtige Daten wie Dateipfade und Klassendefinitionen. Um die genaue Konfiguration zu sehen, kannst du dir die Ultralytics Tiger-Pose Dataset Configuration File ansehen.
Wie kann ich eine Inferenz mit einem auf dem Tiger-Pose Datensatz trainierten YOLO26 Modell durchführen?
Um eine Inferenz mit einem auf dem Tiger-Pose Datensatz trainierten YOLO26 Modell durchzuführen, kannst du die folgenden Code-Snippets verwenden. Eine detaillierte Anleitung findest du auf der Prediction Seite:
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)Was sind die Vorteile der Nutzung des Tiger-Pose Datensatzes für die Pose-Schätzung?
Der Tiger-Pose Datensatz bietet trotz seiner überschaubaren Größe von 210 Trainingsbildern eine vielfältige Sammlung von Bildern, die ideal für das Testen von Pose-Schätzungs-Pipelines sind. Der Datensatz hilft dabei, potenzielle Fehler zu identifizieren und fungiert als vorbereitender Schritt vor der Arbeit mit größeren Datensätzen. Zusätzlich unterstützt der Datensatz das Training und die Verfeinerung von Pose-Schätzungs-Algorithmen mittels fortschrittlicher Tools wie der Ultralytics Platform und YOLO26, was die Modellleistung und Genauigkeit verbessert.