Dog-Pose-Datensatz
Einführung
Der Ultralytics Dog-Pose-Datensatz ist ein hochwertiger und umfangreicher Datensatz, der speziell für die Schätzung von Hunde-Keypoints zusammengestellt wurde. Mit 6.773 Trainingsbildern und 1.703 Testbildern bietet dieser Datensatz eine solide Grundlage für das Training robuster Pose-Schätzungsmodelle.
Ansehen: Wie man Ultralytics YOLO11 auf dem Stanford Dog Pose Estimation Datensatz trainiert | Schritt-für-Schritt-Anleitung 🚀
Jedes annotierte Bild enthält 24 Keypoints mit 3 Dimensionen pro Keypoint (x, y, Sichtbarkeit), was es zu einer wertvollen Ressource für fortgeschrittene Forschung und Entwicklung im Bereich Computer Vision macht.
Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11 vorgesehen.
Datensatz-YAML
Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Datensatzkonfiguration zu definieren. Sie enthält Pfade, Keypoint-Details und andere relevante Informationen. Im Fall des Dog-Pose-Datensatzes ist die dog-pose.yaml
verfügbar unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
Nutzung
Um ein YOLO11n-Pose-Modell auf dem Dog-Pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Training des Modells.
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
sample_images und Anmerkungen
Hier sind einige Beispiele für Bilder aus dem Dog-Pose-Datensatz zusammen mit den entsprechenden Anmerkungen:
- Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus Mosaik-Datensatzbildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird und mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batch zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel veranschaulicht die Vielfalt und Komplexität der Bilder im Dog-pose-Datensatz sowie die Vorteile der Verwendung von Mosaik während des Trainingsprozesses.
Zitate und Danksagungen
Wenn Sie den Dog-pose-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
Wir möchten dem Stanford-Team für die Erstellung und Pflege dieser wertvollen Ressource für die Computer Vision-Community danken. Weitere Informationen über den Dog-pose-Datensatz und seine Ersteller finden Sie auf der Stanford Dogs Dataset-Website.
FAQ
Was ist der Dog-Pose-Datensatz und wie wird er mit Ultralytics YOLO11 verwendet?
Der Dog-Pose-Datensatz enthält 6.773 Trainings- und 1.703 Testbilder, die mit 24 Keypoints für die Schätzung der Hundepose annotiert sind. Er wurde für das Training und die Validierung von Modellen mit Ultralytics YOLO11 entwickelt und unterstützt Anwendungen wie die Analyse des Tierverhaltens, die Überwachung von Haustieren und Veterinärstudien. Die umfassenden Annotationen des Datensatzes machen ihn ideal für die Entwicklung genauer Modelle zur Schätzung der Pose von Hunden.
Wie trainiere ich ein YOLO11-Modell mit dem Dog-Pose-Datensatz in Ultralytics?
Um ein YOLO11n-Pose-Modell auf dem Dog-pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, folgen Sie diesen Beispielen:
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-pose.pt")
# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640
Eine umfassende Liste der Trainingsargumente finden Sie auf der Seite Training des Modells.
Welche Vorteile bietet die Verwendung des Dog-Pose-Datensatzes?
Der Dog-pose-Datensatz bietet mehrere Vorteile:
Großer und vielfältiger Datensatz: Mit über 8.400 Bildern bietet er umfangreiche Daten, die ein breites Spektrum an Hundeposen, Rassen und Kontexten abdecken und ein robustes Modelltraining und eine ebensolche Bewertung ermöglichen.
Detaillierte Keypoint-Annotationen: Jedes Bild enthält 24 Keypoints mit 3 Dimensionen pro Keypoint (x, y, Sichtbarkeit), was präzise Annotationen für das Training von genauen Pose-Erkennungsmodellen bietet.
Realitätsnahe Szenarien: Umfasst Bilder aus verschiedenen Umgebungen, wodurch die Fähigkeit des Modells verbessert wird, auf reale Anwendungen wie Haustierüberwachung und Verhaltensanalyse zu generalisieren.
Transfer Learning Vorteil: Der Datensatz funktioniert gut mit Transfer-Learning-Techniken, wodurch Modelle, die auf Human-Pose-Datensätzen vortrainiert wurden, sich an hundespezifische Merkmale anpassen können.
Weitere Informationen über seine Funktionen und Verwendung finden Sie im Abschnitt Dataset Introduction.
Wie wirkt sich Mosaicing positiv auf den YOLO11-Trainingsprozess mit dem Dog-Pose-Datensatz aus?
Mosaicing, wie in den sample_images aus dem Dog-Pose-Datensatz veranschaulicht, führt mehrere Bilder zu einem einzigen Komposit zusammen und bereichert die Vielfalt der Objekte und Szenen in jedem Trainings-Batch. Diese Technik bietet mehrere Vorteile:
- Erhöht die Vielfalt der Hundeposen, -größen und -hintergründe in jedem Batch
- Verbessert die Fähigkeit des Modells, Hunde in verschiedenen Kontexten und Maßstäben zu erkennen
- Verbessert die Generalisierung, indem das Modell vielfältigeren visuellen Mustern ausgesetzt wird
- Reduziert Overfitting durch Erstellung neuartiger Kombinationen von Trainingsbeispielen
Dieser Ansatz führt zu robusteren Modellen, die in realen Szenarien besser funktionieren. Beispiele für Bilder finden Sie im Abschnitt Beispielbilder und Anmerkungen.
Wo finde ich die YAML-Datei des Dog-Pose-Datensatzes und wie verwende ich sie?
Die YAML-Datei des Dog-Pose-Datensatzes finden Sie unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. Diese Datei definiert die Konfiguration des Datensatzes, einschließlich Pfade, Klassen, Keypoint-Details und andere relevante Informationen. Die YAML-Datei spezifiziert 24 Keypoints mit 3 Dimensionen pro Keypoint, wodurch sie sich für detaillierte Pose-Schätzungsaufgaben eignet.
Um diese Datei mit YOLO11-Trainingsskripten zu verwenden, referenzieren Sie sie einfach in Ihrem Trainingsbefehl, wie im Abschnitt Verwendung gezeigt. Der Datensatz wird beim ersten Gebrauch automatisch heruntergeladen, was die Einrichtung unkompliziert macht.
Weitere FAQs und detaillierte Dokumentationen finden Sie in der Ultralytics-Dokumentation.