Zum Inhalt springen

Hundehaltung-Datensatz

Einführung

Der Ultralytics Hundeposen-Datensatz ist ein hochwertiger und umfangreicher Datensatz, der speziell für die Schätzung von Hunde-Keypoints kuratiert wurde. Mit 6.773 Trainingsbildern und 1.703 Testbildern bietet dieser Datensatz eine solide Grundlage für das Training robuster Modelle zur Posenschätzung. Jedes kommentierte Bild enthält 24 Keypoints mit 3 Dimensionen pro Keypoint (x, y, Sichtbarkeit), was ihn zu einer wertvollen Ressource für fortgeschrittene Forschung und Entwicklung in der Computer Vision macht.

Ultralytics Anzeigebild für die Hundehaltung

Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird zur Definition der Datensatzkonfiguration verwendet. Sie enthält Pfade, Keypoint-Details und andere relevante Informationen. Im Fall des Dog-pose-Datensatzes wird die dog-pose.yaml ist verfügbar unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Verwendung

Um ein YOLO11n-pose-Modell auf dem Dog-pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Beispielbilder und -kommentare

Hier sind einige Beispiele von Bildern aus dem Dog-pose-Datensatz, zusammen mit den entsprechenden Anmerkungen:

Datensatz Beispielbild

  • Mosaikbild: Dieses Bild zeigt einen Trainingsstapel, der aus Mosaikbildern des Datensatzes besteht. Das Mosaikieren ist eine Technik, bei der während des Trainings mehrere Bilder zu einem einzigen Bild kombiniert werden, um die Vielfalt der Objekte und Szenen in jedem Trainingsstapel zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zur Generalisierung auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu verbessern.

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im Dog-pose-Datensatz und die Vorteile der Mosaikbildung während des Trainingsprozesses.

Zitate und Danksagungen

Wenn Sie den Dog-pose-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Wir möchten dem Stanford-Team für die Erstellung und Pflege dieser wertvollen Ressource für die Computer Vision Community danken. Weitere Informationen über den Dog-pose-Datensatz und seine Ersteller finden Sie auf der Website des Stanford Dogs Dataset.

FAQ

Was ist der Datensatz Dog-pose, und wie wird er mit Ultralytics YOLO11 verwendet?

Der Dog-Pose-Datensatz umfasst 6.000 Bilder, die mit 17 Keypoints zur Schätzung der Hundestellung versehen sind. Er ist ideal für das Training und die Validierung von Modellen mit Ultralytics YOLO11eignet er sich für Anwendungen wie Tierverhaltensanalysen und veterinärmedizinische Studien.

Wie trainiere ich ein YOLO11 Modell unter Verwendung des Dog-pose Datensatzes in Ultralytics?

Um ein YOLO11n-Positionsmodell auf dem Datensatz "Hundepose" für 100 Epochen mit einer Bildgröße von 640 zu trainieren, folgen Sie diesen Beispielen:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Eine umfassende Liste der Schulungsargumente finden Sie auf der Seite Modellschulung.

Was sind die Vorteile der Verwendung des Datensatzes Dog-pose?

Der Dog-pose-Datensatz bietet mehrere Vorteile:

Großer und vielfältiger Datensatz: Mit 6.000 Bildern bietet es eine beträchtliche Datenmenge, die ein breites Spektrum an Hundeposen, -rassen und -kontexten abdeckt und ein robustes Modelltraining und -evaluierung ermöglicht.

Posen-spezifische Annotationen: Bietet detaillierte Anmerkungen für die Posenschätzung und gewährleistet so hochwertige Daten für das Training von Modellen zur Posenerkennung.

Szenarien aus der realen Welt: Enthält Bilder aus verschiedenen Umgebungen, die die Verallgemeinerbarkeit des Modells für reale Anwendungen verbessern.

Verbesserung der Modellleistung: Die Vielfalt und der Umfang des Datensatzes tragen dazu bei, die Genauigkeit und Robustheit des Modells zu verbessern, insbesondere bei Aufgaben, die eine feinkörnige Schätzung der Körperhaltung erfordern.

Weitere Informationen zu seinen Funktionen und seiner Verwendung finden Sie im Abschnitt Einführung in das Dataset.

Welchen Nutzen hat das Mosaikieren für den YOLO11 Trainingsprozess unter Verwendung des Dog-pose-Datensatzes?

Wie in den Beispielbildern aus dem Dog-pose-Datensatz dargestellt, werden mehrere Bilder zu einem einzigen Kompositbild zusammengefügt, wodurch die Vielfalt der Objekte und Szenen in jedem Trainingsstapel vergrößert wird. Dieser Ansatz verbessert die Fähigkeit des Modells, über verschiedene Objektgrößen, Seitenverhältnisse und Kontexte hinweg zu generalisieren, was zu einer verbesserten Leistung führt. Beispielbilder finden Sie im Abschnitt Beispielbilder und -kommentare.

Wo finde ich die YAML-Datei des Dog-pose-Datensatzes und wie kann ich sie verwenden?

Die YAML-Datei für den Dog-pose-Datensatz finden Sie hier. Diese Datei definiert die Konfiguration des Datensatzes, einschließlich Pfaden, Klassen und anderen relevanten Informationen. Verwenden Sie diese Datei mit den YOLO11 Trainingsskripten, wie im Abschnitt Train Example erwähnt.

Weitere häufig gestellte Fragen und eine ausführliche Dokumentation finden Sie unter Ultralytics Dokumentation.

📅 Erstellt vor 1 Monat ✏️ Aktualisiert vor 1 Monat

Kommentare