Tiger-Pose Datensatz
Einführung
Ultralytics stellt den Tiger-Pose-Datensatz vor, eine vielseitige Sammlung, die für Pose-Schätzungsaufgaben entwickelt wurde. Dieser Datensatz umfasst 263 Bilder, die aus einem YouTube-Video stammen, wobei 210 Bilder für das Training und 53 für die Validierung zugewiesen sind. Er dient als ausgezeichnete Ressource zum Testen und zur Fehlerbehebung von Pose-Schätzungsalgorithmen.
Trotz seiner überschaubaren Größe von 210 Bildern bietet der Tiger-Pose-Datensatz eine Vielfalt, die ihn für die Bewertung von Trainingspipelines, die Identifizierung potenzieller Fehler und als wertvollen ersten Schritt vor der Arbeit mit größeren Datensätzen für die Pose-Schätzung geeignet macht.
Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11 vorgesehen.
Ansehen: Trainieren Sie das YOLO11 Pose-Modell auf dem Tiger-Pose-Datensatz mit Ultralytics HUB
Datensatz-YAML
Eine YAML-Datei (Yet Another Markup Language) dient dazu, die Konfigurationsdetails eines Datensatzes festzulegen. Sie umfasst wichtige Daten wie Dateipfade, Klassendefinitionen und andere relevante Informationen. Insbesondere für die tiger-pose.yaml
Datei können Sie Ultralytics Tiger-Pose Dataset Konfigurationsdatei.
ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── tiger-pose ← downloads here (49.8 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images
# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
# Classes
names:
0: tiger
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip
Nutzung
Um ein YOLO11n-Pose-Modell auf dem Tiger-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite des Modells.
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
sample_images und Anmerkungen
Hier sind einige Beispiele für Bilder aus dem Tiger-Pose-Datensatz zusammen mit den dazugehörigen Anmerkungen:
- Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus Mosaik-Datensatzbildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird und mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batch zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel demonstriert die Vielfalt und Komplexität der Bilder im Tiger-Pose-Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.
Inferenz Beispiel
Inferenz Beispiel
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Zitate und Danksagungen
Der Datensatz wurde unter der AGPL-3.0-Lizenz veröffentlicht.
FAQ
Wofür wird der Ultralytics Tiger-Pose-Datensatz verwendet?
Der Ultralytics Tiger-Pose-Datensatz ist für Pose-Schätzungsaufgaben konzipiert und besteht aus 263 Bildern, die aus einem YouTube-Video stammen. Der Datensatz ist in 210 Trainingsbilder und 53 Validierungsbilder unterteilt. Er ist besonders nützlich für das Testen, Trainieren und Verfeinern von Pose-Schätzungsalgorithmen mit Ultralytics HUB und YOLO11.
Wie trainiere ich ein YOLO11-Modell auf dem Tiger-Pose Datensatz?
Um ein YOLO11n-Pose-Modell auf dem Tiger-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwenden Sie die folgenden Code-Snippets. Weitere Informationen finden Sie auf der Trainings-Seite:
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Welche Konfigurationen bietet tiger-pose.yaml
Datei enthalten?
Die tiger-pose.yaml
Datei dient zur Angabe der Konfigurationsdetails des Tiger-Pose-Datensatzes. Sie enthält wichtige Daten wie Dateipfade und Klassendefinitionen. Um die genaue Konfiguration einzusehen, können Sie die Ultralytics Tiger-Pose Dataset Konfigurationsdatei.
Wie kann ich Inferenz mit einem YOLO11-Modell durchführen, das auf dem Tiger-Pose-Datensatz trainiert wurde?
Um Inferenz mit einem YOLO11-Modell durchzuführen, das auf dem Tiger-Pose-Datensatz trainiert wurde, können Sie die folgenden Code-Snippets verwenden. Eine detaillierte Anleitung finden Sie auf der Seite Vorhersage:
Inferenz Beispiel
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a tiger-pose trained model
# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"
Welche Vorteile bietet die Verwendung des Tiger-Pose-Datensatzes für die Pose-Schätzung?
Der Tiger-Pose-Datensatz bietet trotz seiner überschaubaren Größe von 210 Bildern für das Training eine vielfältige Sammlung von Bildern, die sich ideal zum Testen von Pose-Schätzungs-Pipelines eignen. Der Datensatz hilft, potenzielle Fehler zu identifizieren, und dient als vorbereitender Schritt vor der Arbeit mit größeren Datensätzen. Darüber hinaus unterstützt der Datensatz das Training und die Verfeinerung von Pose-Schätzungsalgorithmen mit fortschrittlichen Tools wie Ultralytics HUB und YOLO11, wodurch die Modellleistung und -genauigkeit verbessert werden.