Link to this sectionDog-Pose-Datensatz#

Link to this sectionEinführung#

Das Ultralytics Dog-Pose-Dataset ist ein hochwertiger und umfangreicher Datensatz, der speziell für die Keypoint-Estimation bei Hunden kuratiert wurde und 6.773 Trainings- sowie 1.703 Validierungsbilder umfasst.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Jedes annotierte Bild enthält 24 Keypoints mit jeweils 3 Dimensionen (x, y, Sichtbarkeit), was ihn zu einer wertvollen Ressource für fortgeschrittene Forschung und Entwicklung im Bereich Computer Vision macht.

Für eine bestimmte Rasse oder ein ganz anderes Tier kümmert sich die Ultralytics Platform um das Hochladen, Labeln und Trainieren eines benutzerdefinierten Keypoint-Modells mit deinen eigenen Daten, ohne dass du dich um die Infrastruktur kümmern musst.

Link to this sectionDatensatzstruktur#

Gesamtzahl der Bilder: 8.476 (6.773 Training / 1.703 Validierung) mit passenden Label-Dateien im YOLO-Format.
Keypoints: 24 pro Hund mit (x, y, visibility)-Tripeln.
Download-Größe: ~337 MB.

Layout:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionDatensatz-YAML#

Eine YAML-Datei wird verwendet, um die Dataset-Konfiguration zu definieren. Sie enthält Pfade, Details zu Keypoints und andere relevante Informationen. Im Fall des Dog-Pose-Datasets ist die dog-pose.yaml-Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml verfügbar.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionVerwendung#

Um ein YOLO26n-pose-Modell mit dem Dog-Pose-Dataset für 100 Epochen bei einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine vollständige Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionBeispielbilder und Annotationen#

Hier sind einige Beispiele für Bilder aus dem Dog-Pose-Dataset zusammen mit den entsprechenden Annotationen:

Dog pose estimation dataset mosaic training batch

Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatz-Bildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Bilder im Dog-Pose-Dataset sowie die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Link to this sectionZitate und Danksagungen#

Wenn du das Dog-Pose-Dataset für deine Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Wir möchten dem Stanford-Team dafür danken, dass es diese wertvolle Ressource für die Computer-Vision-Community erstellt und gepflegt hat. Weitere Informationen über das Dog-Pose-Dataset und seine Ersteller findest du auf der Website des Stanford Dogs Datasets.

Link to this sectionFAQ#

Link to this sectionWas ist das Dog-Pose-Dataset und wie wird es mit Ultralytics YOLO26 verwendet?#

Das Dog-Pose-Dataset enthält 6.773 Trainings- und 1.703 Validierungsbilder, die mit 24 Keypoints für die Hunde-Pose-Estimation annotiert sind. Es wurde für das Training und die Validierung von Modellen mit Ultralytics YOLO26 entwickelt und unterstützt Anwendungen wie Verhaltensanalysen bei Tieren, Haustierüberwachung und veterinärmedizinische Studien. Die umfassenden Annotationen des Datensatzes machen ihn ideal für die Entwicklung präziser Pose-Estimation-Modelle für Hunde.

Link to this sectionWie trainiere ich ein YOLO26-Modell mit dem Dog-Pose-Dataset in Ultralytics?#

Lade yolo26n-pose.pt und rufe model.train(data="dog-pose.yaml", epochs=100, imgsz=640) auf – siehe das Train-Beispiel oben für die vollständigen Python- und CLI-Snippets sowie die Seite zum Modell-Training für eine umfassende Liste der Argumente.

Link to this sectionWas sind die Vorteile der Verwendung des Dog-Pose-Datasets?#

Mit insgesamt 8.476 Bildern (6.773 Training / 1.703 Validierung), die eine große Bandbreite an Hunderassen und Posen abdecken, sowie 24 Keypoints in 3 Dimensionen (x, y, Sichtbarkeit) pro Annotation bietet das Dog-Pose-Dataset die für reale Szenarien notwendige Abdeckung für Anwendungen wie Haustierüberwachung und Verhaltensanalyse. Weitere Informationen zu den Funktionen und der Verwendung findest du im Abschnitt Einführung zum Dataset.

Link to this sectionWelche Vorteile bietet Mosaicing für den YOLO26-Trainingsprozess mit dem Dog-Pose-Dataset?#

Mosaicing kombiniert mehrere Dog-Pose-Bilder zu einem einzigen Trainingsbild. Dies erhöht die Vielfalt an Hundeposen, Größen und Hintergründen, die das Modell pro Schritt sieht, was die Generalisierung auf neue Kontexte und Skalierungen verbessert und Overfitting reduziert. Beispielbilder findest du im Abschnitt Beispielbilder und Annotationen.

Link to this sectionWo finde ich die YAML-Datei des Dog-Pose-Datasets und wie verwende ich sie?#

Die YAML-Datei des Dog-Pose-Datasets findest du unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Diese Datei definiert die Dataset-Konfiguration, einschließlich Pfaden, Klassen, Keypoint-Details und anderen relevanten Informationen. Das YAML spezifiziert 24 Keypoints mit 3 Dimensionen pro Keypoint, was es für detaillierte Pose-Estimation-Aufgaben geeignet macht.

Um diese Datei mit YOLO26-Trainingsskripten zu verwenden, verweise einfach in deinem Trainingsbefehl darauf, wie im Abschnitt Verwendung gezeigt. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen, was die Einrichtung unkompliziert macht.

Für mehr Informationen zu Keypoint-Modellen, siehe die Pose Estimation Aufgaben-Dokumentation.

Mitwirkende

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

Erstellt 16. Nov. 2024Aktualisiert vor 3 Tagen