Meet YOLO26: next-gen vision AI.

Link to this sectionDog-Pose-Datensatz#

Link to this sectionEinführung#

Der Ultralytics Dog-Pose-Datensatz ist ein hochwertiger und umfangreicher Datensatz, der speziell für die Keypoint-Schätzung bei Hunden kuratiert wurde. Mit 6.773 Trainingsbildern und 1.703 Testbildern bietet dieser Datensatz eine solide Grundlage für das Training robuster Modelle zur Pose-Schätzung.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

Jedes annotierte Bild enthält 24 Keypoints mit jeweils 3 Dimensionen (x, y, Sichtbarkeit), was ihn zu einer wertvollen Ressource für fortgeschrittene Forschung und Entwicklung im Bereich Computer Vision macht.

Ultralytics Dog-pose display image

Dieser Datensatz ist für die Verwendung mit der Ultralytics Platform und YOLO26 konzipiert.

Link to this sectionDatensatzstruktur#

  • Split: 6.773 Trainings- / 1.703 Validierungsbilder mit zugehörigen Label-Dateien im YOLO-Format.

  • Keypoints: 24 per dog with (x, y, visibility) triplets.

  • Layout:

    datasets/dog-pose/
    ├── images/{train,val}
    └── labels/{train,val}

Link to this sectionDatensatz-YAML#

Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Datensatzkonfiguration zu definieren. Sie enthält Pfade, Keypoint-Details und andere relevante Informationen. Im Fall des Dog-Pose-Datensatzes ist die dog-pose.yaml unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml verfügbar.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionVerwendung#

Um ein YOLO26n-pose-Modell auf dem Dog-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite zum Modell-Training.

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionBeispielbilder und Annotationen#

Hier sind einige Beispiele für Bilder aus dem Dog-Pose-Datensatz zusammen mit ihren entsprechenden Annotationen:

Dog pose estimation dataset mosaic training batch
  • Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatz-Bildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im Dog-Pose-Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Link to this sectionZitate und Danksagungen#

Wenn du den Dog-Pose-Datensatz in deiner Forschungs- oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Wir möchten dem Stanford-Team für die Erstellung und Pflege dieser wertvollen Ressource für die Computer Vision-Community danken. Weitere Informationen über den Dog-Pose-Datensatz und seine Ersteller findest du auf der Website des Stanford Dogs-Datensatzes.

Link to this sectionFAQ#

Link to this sectionWas ist der Dog-Pose-Datensatz und wie wird er mit Ultralytics YOLO26 verwendet?#

Der Dog-Pose-Datensatz umfasst 6.773 Trainings- und 1.703 Testbilder, die mit 24 Keypoints zur Pose-Schätzung bei Hunden annotiert sind. Er wurde für das Training und die Validierung von Modellen mit Ultralytics YOLO26 entwickelt und unterstützt Anwendungen wie die Analyse tierischen Verhaltens, Haustierüberwachung und veterinärmedizinische Studien. Die umfassenden Annotationen des Datensatzes machen ihn ideal für die Entwicklung präziser Modelle zur Pose-Schätzung bei Hunden.

Link to this sectionWie trainiere ich ein YOLO26-Modell mit dem Dog-Pose-Datensatz in Ultralytics?#

Um ein YOLO26n-pose-Modell auf dem Dog-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, folge diesen Beispielen:

Trainingsbeispiel
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Eine umfassende Liste der Trainingsargumente findest du auf der Seite zum Modell-Training.

Link to this sectionWelche Vorteile bietet die Verwendung des Dog-Pose-Datensatzes?#

Der Dog-Pose-Datensatz bietet mehrere Vorteile:

Großer und vielfältiger Datensatz: Mit über 8.400 Bildern bietet er umfangreiche Daten, die ein breites Spektrum an Posen, Hunderassen und Kontexten abdecken, was ein robustes Modelltraining und eine gute Evaluierung ermöglicht.

Detaillierte Keypoint-Annotationen: Jedes Bild enthält 24 Keypoints mit jeweils 3 Dimensionen (x, y, Sichtbarkeit) und bietet präzise Annotationen für das Training genauer Modelle zur Pose-Erkennung.

Real-World-Szenarien: Enthält Bilder aus verschiedenen Umgebungen, was die Fähigkeit des Modells verbessert, auf reale Anwendungen wie Haustierüberwachung und Verhaltensanalyse zu generalisieren.

Vorteile durch Transfer Learning: Der Datensatz funktioniert gut mit Transfer Learning-Techniken, wodurch Modelle, die auf Datensätzen für menschliche Posen vortrainiert wurden, an hundespezifische Merkmale angepasst werden können.

Mehr über seine Funktionen und Verwendung erfährst du im Abschnitt Datensatz-Einführung.

Link to this sectionWie profitiert der YOLO26-Trainingsprozess mit dem Dog-Pose-Datensatz von Mosaicing?#

Mosaicing, wie in den Beispielbildern aus dem Dog-Pose-Datensatz dargestellt, führt mehrere Bilder zu einer einzigen Komposition zusammen und bereichert so die Vielfalt der Objekte und Szenen in jedem Trainingsbatch. Diese Technik bietet mehrere Vorteile:

  • Erhöht die Vielfalt an Hundeposen, -größen und Hintergründen in jedem Batch
  • Verbessert die Fähigkeit des Modells, Hunde in verschiedenen Kontexten und Maßstäben zu erkennen
  • Stärkt die Generalisierung, indem das Modell mit vielfältigeren visuellen Mustern konfrontiert wird
  • Reduziert Overfitting durch die Erstellung neuartiger Kombinationen von Trainingsbeispielen

Dieser Ansatz führt zu robusteren Modellen, die in realen Szenarien besser funktionieren. Beispiele für Bilder findest du im Abschnitt Beispielbilder und Annotationen.

Link to this sectionWo finde ich die YAML-Datei für den Dog-Pose-Datensatz und wie verwende ich sie?#

Die YAML-Datei für den Dog-Pose-Datensatz findest du unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Diese Datei definiert die Datensatzkonfiguration, einschließlich Pfaden, Klassen, Keypoint-Details und anderer relevanter Informationen. Das YAML spezifiziert 24 Keypoints mit jeweils 3 Dimensionen, was es für detaillierte Aufgaben der Pose-Schätzung geeignet macht.

Um diese Datei mit YOLO26-Trainingsskripten zu verwenden, verweise einfach in deinem Trainingsbefehl darauf, wie im Abschnitt Verwendung gezeigt. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen, was die Einrichtung unkompliziert macht.

Für weitere FAQs und detaillierte Dokumentation besuche die Ultralytics-Dokumentation.

Kommentare