Zum Inhalt springen

Tiger-Pose Datensatz

Einführung

Ultralytics stellt den Tiger-Pose-Datensatz vor, eine vielseitige Sammlung, die für Pose-Schätzungsaufgaben entwickelt wurde. Dieser Datensatz umfasst 263 Bilder, die aus einem YouTube-Video stammen, wobei 210 Bilder für das Training und 53 für die Validierung zugewiesen sind. Er dient als ausgezeichnete Ressource zum Testen und zur Fehlerbehebung von Pose-Schätzungsalgorithmen.

Trotz seiner überschaubaren Größe von 210 Bildern bietet der Tiger-Pose-Datensatz eine Vielfalt, die ihn für die Bewertung von Trainingspipelines, die Identifizierung potenzieller Fehler und als wertvollen ersten Schritt vor der Arbeit mit größeren Datensätzen für die Pose-Schätzung geeignet macht.

Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11 vorgesehen.



Ansehen: Trainieren Sie das YOLO11 Pose-Modell auf dem Tiger-Pose-Datensatz mit Ultralytics HUB

Datensatz-YAML

Eine YAML-Datei (Yet Another Markup Language) dient dazu, die Konfigurationsdetails eines Datensatzes festzulegen. Sie umfasst wichtige Daten wie Dateipfade, Klassendefinitionen und andere relevante Informationen. Insbesondere für die tiger-pose.yaml Datei können Sie Ultralytics Tiger-Pose Dataset Konfigurationsdatei.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

Nutzung

Um ein YOLO11n-Pose-Modell auf dem Tiger-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

sample_images und Anmerkungen

Hier sind einige Beispiele für Bilder aus dem Tiger-Pose-Datensatz zusammen mit den dazugehörigen Anmerkungen:

Beispielbild des Datensatzes

  • Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus Mosaik-Datensatzbildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird und mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batch zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel demonstriert die Vielfalt und Komplexität der Bilder im Tiger-Pose-Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Inferenz Beispiel

Inferenz Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Zitate und Danksagungen

Der Datensatz wurde unter der AGPL-3.0-Lizenz veröffentlicht.

FAQ

Wofür wird der Ultralytics Tiger-Pose-Datensatz verwendet?

Der Ultralytics Tiger-Pose-Datensatz ist für Pose-Schätzungsaufgaben konzipiert und besteht aus 263 Bildern, die aus einem YouTube-Video stammen. Der Datensatz ist in 210 Trainingsbilder und 53 Validierungsbilder unterteilt. Er ist besonders nützlich für das Testen, Trainieren und Verfeinern von Pose-Schätzungsalgorithmen mit Ultralytics HUB und YOLO11.

Wie trainiere ich ein YOLO11-Modell auf dem Tiger-Pose Datensatz?

Um ein YOLO11n-Pose-Modell auf dem Tiger-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwenden Sie die folgenden Code-Snippets. Weitere Informationen finden Sie auf der Trainings-Seite:

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Welche Konfigurationen bietet tiger-pose.yaml Datei enthalten?

Die tiger-pose.yaml Datei dient zur Angabe der Konfigurationsdetails des Tiger-Pose-Datensatzes. Sie enthält wichtige Daten wie Dateipfade und Klassendefinitionen. Um die genaue Konfiguration einzusehen, können Sie die Ultralytics Tiger-Pose Dataset Konfigurationsdatei.

Wie kann ich Inferenz mit einem YOLO11-Modell durchführen, das auf dem Tiger-Pose-Datensatz trainiert wurde?

Um Inferenz mit einem YOLO11-Modell durchzuführen, das auf dem Tiger-Pose-Datensatz trainiert wurde, können Sie die folgenden Code-Snippets verwenden. Eine detaillierte Anleitung finden Sie auf der Seite Vorhersage:

Inferenz Beispiel

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://youtu.be/MIBAT6BGE6U" show=True model="path/to/best.pt"

Welche Vorteile bietet die Verwendung des Tiger-Pose-Datensatzes für die Pose-Schätzung?

Der Tiger-Pose-Datensatz bietet trotz seiner überschaubaren Größe von 210 Bildern für das Training eine vielfältige Sammlung von Bildern, die sich ideal zum Testen von Pose-Schätzungs-Pipelines eignen. Der Datensatz hilft, potenzielle Fehler zu identifizieren, und dient als vorbereitender Schritt vor der Arbeit mit größeren Datensätzen. Darüber hinaus unterstützt der Datensatz das Training und die Verfeinerung von Pose-Schätzungsalgorithmen mit fortschrittlichen Tools wie Ultralytics HUB und YOLO11, wodurch die Modellleistung und -genauigkeit verbessert werden.



📅 Vor 1 Jahr erstellt ✏️ Vor 5 Monaten aktualisiert

Kommentare