مجموعة بيانات Dog-Pose

مقدمة

مجموعة بيانات Dog-Pose من Ultralytics هي مجموعة بيانات واسعة وعالية الجودة تم إعدادها خصيصاً لتقدير النقاط الرئيسية للكلاب. مع 6,773 صورة للتدريب و1,703 صورة للاختبار، توفر مجموعة البيانات هذه أساساً قوياً لتدريب نماذج قوية لتقدير الوضعية.



Watch: How to Train Ultralytics YOLO26 on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

تتضمن كل صورة مشروحة 24 نقطة رئيسية بـ 3 أبعاد لكل نقطة (x، y، الرؤية)، مما يجعلها مورداً قيماً للبحث والتطوير المتقدم في الرؤية الحاسوبية.

Ultralytics Dog-pose display image

تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.

هيكل مجموعة البيانات

  • التقسيم: 6,773 صورة للتدريب / 1,703 صورة للاختبار مع ملفات تسميات بتنسيق YOLO مطابقة.

  • النقاط الرئيسية: 24 لكل كلب مع ثلاثيات (x, y, visibility).

  • التخطيط:

    datasets/dog-pose/
    ├── images/{train,test}
    └── labels/{train,test}

ملف YAML الخاص بمجموعة البيانات

يتم استخدام ملف YAML (Yet Another Markup Language) لتحديد تكوين مجموعة البيانات. وهو يتضمن المسارات وتفاصيل النقاط الرئيسية ومعلومات أخرى ذات صلة. في حالة مجموعة بيانات Dog-pose، يتوفر ملف dog-pose.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

الاستخدام

لتدريب نموذج YOLO26n-pose على مجموعة بيانات Dog-pose لمدة 100 دورة تدريبية بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

صور وعينات تعليقات توضيحية

فيما يلي بعض الأمثلة على صور من مجموعة بيانات Dog-pose، إلى جانب التعليقات التوضيحية المقابلة لها:

Dog pose estimation dataset mosaic training batch
  • صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات Dog-pose وفوائد استخدام الفسيفساء (mosaicing) أثناء عملية التدريب.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات Dog-pose في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

نود أن نشكر فريق جامعة ستانفورد على إنشاء هذا المورد القيم والحفاظ عليه لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات Dog-pose ومبتكريها، تفضل بزيارة موقع مجموعة بيانات ستانفورد للكلاب.

الأسئلة الشائعة

ما هي مجموعة بيانات Dog-pose، وكيف يتم استخدامها مع Ultralytics YOLO26؟

تتميز مجموعة بيانات Dog-Pose بـ 6,773 صورة للتدريب و1,703 صورة للاختبار مشروحة بـ 24 نقطة رئيسية لتقدير وضعية الكلاب. وهي مصممة لتدريب وتقييم النماذج باستخدام Ultralytics YOLO26، وتدعم تطبيقات مثل تحليل سلوك الحيوان، ومراقبة الحيوانات الأليفة، والدراسات البيطرية. تجعل التعليقات التوضيحية الشاملة للمجموعة مثالية لتطوير نماذج دقيقة لتقدير وضعية الكلاب.

كيف يمكنني تدريب نموذج YOLO26 باستخدام مجموعة بيانات Dog-pose في Ultralytics؟

لتدريب نموذج YOLO26n-pose على مجموعة بيانات Dog-pose لمدة 100 دورة تدريبية بحجم صورة 640، اتبع هذه الأمثلة:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

للحصول على قائمة شاملة بحجج التدريب، راجع صفحة التدريب الخاصة بالنموذج.

ما هي فوائد استخدام مجموعة بيانات Dog-pose؟

تقدم مجموعة بيانات Dog-pose العديد من المزايا:

مجموعة بيانات كبيرة ومتنوعة: مع أكثر من 8,400 صورة، توفر بيانات جوهرية تغطي مجموعة واسعة من وضعيات الكلاب، والسلالات، والسياقات، مما يتيح تدريب وتقييم نماذج قوية.

تعليقات توضيحية مفصلة للنقاط الرئيسية: تتضمن كل صورة 24 نقطة رئيسية بـ 3 أبعاد لكل نقطة (x، y، الرؤية)، مما يوفر تعليقات توضيحية دقيقة لتدريب نماذج دقيقة لاكتشاف الوضعية.

سيناريوهات العالم الحقيقي: تتضمن صوراً من بيئات متنوعة، مما يعزز قدرة النموذج على التعميم في تطبيقات العالم الحقيقي مثل مراقبة الحيوانات الأليفة وتحليل السلوك.

ميزة التعلم بنقل المعرفة: تعمل مجموعة البيانات بشكل جيد مع تقنيات التعلم بنقل المعرفة، مما يسمح للنماذج المدربة مسبقاً على مجموعات بيانات وضعيات البشر بالتكيف مع الخصائص الخاصة بالكلاب.

لمزيد من المعلومات حول ميزاتها واستخدامها، راجع قسم مقدمة مجموعة البيانات.

كيف تفيد الفسيفساء (mosaicing) عملية تدريب YOLO26 باستخدام مجموعة بيانات Dog-pose؟

تعمل الفسيفساء، كما هو موضح في الصور العينة من مجموعة بيانات Dog-pose، على دمج صور متعددة في تركيبة واحدة، مما يثري تنوع الكائنات والمشاهد في كل دفعة تدريب. توفر هذه التقنية العديد من المزايا:

  • تزيد من تنوع وضعيات وأحجام وخلفيات الكلاب في كل دفعة
  • تحسن قدرة النموذج على اكتشاف الكلاب في سياقات ومقاييس مختلفة
  • تعزز التعميم من خلال تعريض النموذج لأنماط بصرية أكثر تنوعاً
  • تقلل من الإفراط في التخصيص (overfitting) عن طريق إنشاء مجموعات جديدة من أمثلة التدريب

يؤدي هذا النهج إلى نماذج أكثر قوة تقدم أداءً أفضل في سيناريوهات العالم الحقيقي. للحصول على صور توضيحية، راجع قسم الصور العينة والتعليقات التوضيحية.

أين يمكنني العثور على ملف YAML الخاص بمجموعة بيانات Dog-pose وكيف يمكنني استخدامه؟

يمكن العثور على ملف YAML الخاص بمجموعة بيانات Dog-pose على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. يحدد هذا الملف تكوين مجموعة البيانات، بما في ذلك المسارات، والفئات، وتفاصيل النقاط الرئيسية، ومعلومات أخرى ذات صلة. يحدد ملف YAML 24 نقطة رئيسية بـ 3 أبعاد لكل نقطة، مما يجعله مناسباً لمهام تقدير الوضعية المفصلة.

لاستخدام هذا الملف مع نصوص تدريب YOLO26، ما عليك سوى الإشارة إليه في أمر التدريب الخاص بك كما هو موضح في قسم الاستخدام. سيتم تنزيل مجموعة البيانات تلقائياً عند استخدامها لأول مرة، مما يجعل الإعداد سهلاً.

لمزيد من الأسئلة الشائعة والوثائق التفصيلية، تفضل بزيارة وثائق Ultralytics.

التعليقات