Zum Inhalt springen

Hundehaltung-Datensatz

Einführung

Der Ultralytics Hundeposen-Datensatz ist ein hochwertiger und umfangreicher Datensatz, der speziell für die Schätzung von Hunde-Keypoints kuratiert wurde. Mit 6.773 Trainingsbildern und 1.703 Testbildern bietet dieser Datensatz eine solide Grundlage für das Training robuster Modelle zur Posenschätzung. Jedes kommentierte Bild enthält 24 Keypoints mit 3 Dimensionen pro Keypoint (x, y, Sichtbarkeit), was ihn zu einer wertvollen Ressource für fortgeschrittene Forschung und Entwicklung in der Computer Vision macht.

Ultralytics Anzeigebild für die Hundehaltung

Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird zur Definition der Datensatzkonfiguration verwendet. Sie enthält Pfade, Keypoint-Details und andere relevante Informationen. Im Fall des Dog-pose-Datensatzes wird die dog-pose.yaml ist verfügbar unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose  ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Verwendung

Um ein YOLO11n-pose-Modell auf dem Dog-pose-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Beispielbilder und -kommentare

Hier sind einige Beispiele von Bildern aus dem Dog-pose-Datensatz, zusammen mit den entsprechenden Anmerkungen:

Datensatz Beispielbild

  • Mosaikbild: Dieses Bild zeigt einen Trainingsstapel, der aus Mosaikbildern des Datensatzes besteht. Das Mosaikieren ist eine Technik, bei der während des Trainings mehrere Bilder zu einem einzigen Bild kombiniert werden, um die Vielfalt der Objekte und Szenen in jedem Trainingsstapel zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zur Generalisierung auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu verbessern.

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im Dog-pose-Datensatz und die Vorteile der Mosaikbildung während des Trainingsprozesses.

Zitate und Danksagungen

Wenn Sie den Dog-pose-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

Wir möchten dem Stanford-Team für die Erstellung und Pflege dieser wertvollen Ressource für die Computer Vision Community danken. Weitere Informationen über den Dog-pose-Datensatz und seine Ersteller finden Sie auf der Website des Stanford Dogs Dataset.

FAQ

Was ist der Datensatz Dog-pose, und wie wird er mit Ultralytics YOLO11 verwendet?

Der Dog-Pose-Datensatz umfasst 6.773 Trainings- und 1.703 Testbilder, die mit 24 Keypoints für die Schätzung der Hundestellung versehen sind. Er wurde für das Training und die Validierung von Modellen mit Ultralytics YOLO11entwickelt und unterstützt Anwendungen wie Tierverhaltensanalyse, Haustierüberwachung und veterinärmedizinische Studien. Die umfassenden Anmerkungen des Datensatzes machen ihn ideal für die Entwicklung genauer Modelle zur Schätzung der Körperhaltung von Hunden.

Wie trainiere ich ein YOLO11 Modell unter Verwendung des Dog-pose Datensatzes in Ultralytics?

Um ein YOLO11n-Positionsmodell auf dem Datensatz "Hundepose" für 100 Epochen mit einer Bildgröße von 640 zu trainieren, folgen Sie diesen Beispielen:

Beispiel für einen Zug

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)
yolo pose train data=dog-pose.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

Eine umfassende Liste der Schulungsargumente finden Sie auf der Seite Modellschulung.

Was sind die Vorteile der Verwendung des Datensatzes Dog-pose?

Der Dog-pose-Datensatz bietet mehrere Vorteile:

Großer und vielfältiger Datensatz: Mit über 8.400 Bildern bietet es umfangreiche Daten, die ein breites Spektrum an Hundeposen, -rassen und -kontexten abdecken und ein robustes Modelltraining und -evaluierung ermöglichen.

Detaillierte Keypoint-Beschriftungen: Jedes Bild enthält 24 Keypoints mit 3 Dimensionen pro Keypoint (x, y, Sichtbarkeit), die präzise Anmerkungen für das Training präziser Modelle zur Posenerkennung bieten.

Szenarien aus der realen Welt: Enthält Bilder aus verschiedenen Umgebungen, die die Verallgemeinerbarkeit des Modells für reale Anwendungen wie Haustierüberwachung und Verhaltensanalyse verbessern.

Vorteil des Transferlernens: Der Datensatz eignet sich gut für Transfer-Learning-Techniken, so dass Modelle, die zuvor auf Datensätzen mit menschlicher Körperhaltung trainiert wurden, an hundespezifische Merkmale angepasst werden können.

Weitere Informationen zu seinen Funktionen und seiner Verwendung finden Sie im Abschnitt Einführung in das Dataset.

Welchen Nutzen hat das Mosaikieren für den YOLO11 Trainingsprozess unter Verwendung des Dog-pose-Datensatzes?

Wie in den Beispielbildern aus dem Dog-pose-Datensatz veranschaulicht, werden mehrere Bilder zu einem einzigen Kompositbild zusammengefügt, wodurch die Vielfalt der Objekte und Szenen in jedem Trainingsstapel vergrößert wird. Diese Technik bietet mehrere Vorteile:

  • Erhöht die Vielfalt der Hundeposen, -größen und -hintergründe in jeder Partie
  • Verbessert die Fähigkeit des Modells, Hunde in verschiedenen Kontexten und Maßstäben zu erkennen
  • Verbessert die Verallgemeinerung, indem das Modell vielfältigeren visuellen Mustern ausgesetzt wird
  • Verringert die Überanpassung durch die Erstellung neuer Kombinationen von Trainingsbeispielen

Dieser Ansatz führt zu robusteren Modellen, die in realen Szenarien besser funktionieren. Beispielbilder finden Sie im Abschnitt Beispielbilder und -kommentare.

Wo finde ich die YAML-Datei des Dog-pose-Datensatzes und wie kann ich sie verwenden?

Die YAML-Datei des Dog-pose-Datensatzes finden Sie hier. Diese Datei definiert die Konfiguration des Datensatzes, einschließlich Pfaden, Klassen, Keypoint-Details und anderen relevanten Informationen. Die YAML spezifiziert 24 Keypoints mit 3 Dimensionen pro Keypoint, wodurch sie sich für detaillierte Posenschätzungsaufgaben eignet.

Um diese Datei mit YOLO11 zu verwenden, referenzieren Sie sie einfach in Ihrem Trainingsbefehl, wie im Abschnitt " Verwendung" gezeigt. Der Datensatz wird bei der ersten Verwendung automatisch heruntergeladen, so dass die Einrichtung einfach ist.

Weitere häufig gestellte Fragen und eine ausführliche Dokumentation finden Sie unter Ultralytics Dokumentation.

📅 Erstellt vor 4 Monaten ✏️ Aktualisiert vor 8 Tagen

Kommentare