Link to this sectionمجموعة بيانات Dog-Pose#

Link to this sectionمقدمة#

يعد مجموعة بيانات Ultralytics Dog-Pose مجموعة بيانات واسعة وعالية الجودة تم إعدادها خصيصاً لتقدير النقاط الرئيسية للكلاب، حيث توفر 6,773 صورة للتدريب و1,703 صورة للتحقق.

Watch: How to Train an Ultralytics YOLO Model on the Stanford Dog Pose Estimation Dataset | Step-by-Step Tutorial

تحتوي كل صورة معلّقة على 24 نقطة رئيسية مع 3 أبعاد لكل نقطة (x، y، الرؤية)، مما يجعلها مورداً قيّماً للبحث والتطوير المتقدم في الرؤية الحاسوبية.

بالنسبة لسلالة معينة أو حيوان مختلف تماماً، تتعامل Ultralytics Platform مع تحميل وتصنيف وتدريب نموذج نقاط رئيسية مخصص على بياناتك الخاصة دون الحاجة إلى إدارة البنية التحتية.

Link to this sectionهيكل مجموعة البيانات#

إجمالي الصور: 8,476 (6,773 للتدريب / 1,703 للتحقق) مع ملفات تسميات مطابقة بتنسيق YOLO.
النقاط الرئيسية: 24 نقطة لكل كلب مع ثلاثيات (x, y, visibility).
حجم التنزيل: ~337 ميجابايت.

التخطيط:

datasets/dog-pose/
├── images/{train,val}
└── labels/{train,val}

Link to this sectionYAML مجموعة البيانات#

يُستخدم ملف YAML لتحديد إعدادات مجموعة البيانات. وهو يتضمن المسارات، وتفاصيل النقاط الرئيسية، وغيرها من المعلومات ذات الصلة. في حالة مجموعة بيانات Dog-Pose، يتوفر ملف dog-pose.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.

ultralytics/cfg/datasets/dog-pose.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dog-pose ← downloads here (337 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dog-pose # dataset root dir
train: images/train # train images (relative to 'path') 6773 images
val: images/val # val images (relative to 'path') 1703 images

# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)

# Classes
names:
  0: dog

# Keypoint names per class
kpt_names:
  0:
    - front_left_paw
    - front_left_knee
    - front_left_elbow
    - rear_left_paw
    - rear_left_knee
    - rear_left_elbow
    - front_right_paw
    - front_right_knee
    - front_right_elbow
    - rear_right_paw
    - rear_right_knee
    - rear_right_elbow
    - tail_start
    - tail_end
    - left_ear_base
    - right_ear_base
    - nose
    - chin
    - left_ear_tip
    - right_ear_tip
    - left_eye
    - right_eye
    - withers
    - throat

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip

Link to this sectionالاستخدام#

لتدريب نموذج YOLO26n-pose على مجموعة بيانات Dog-Pose لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dog-pose.yaml", epochs=100, imgsz=640)

Link to this sectionصور وشروحات توضيحية عينة#

فيما يلي بعض الأمثلة للصور من مجموعة بيانات Dog-Pose، بالإضافة إلى التعليقات التوضيحية المقابلة لها:

Dog pose estimation dataset mosaic training batch

صورة مجمعة (Mosaiced Image): توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات مجمعة. الفسيفساء (Mosaicing) هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات Dog-Pose وفوائد استخدام التجميع (mosaicing) أثناء عملية التدريب.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات Dog-Pose في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@inproceedings{khosla2011fgvc,
  title={Novel dataset for Fine-Grained Image Categorization},
  author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
  booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
  year={2011}
}
@inproceedings{deng2009imagenet,
  title={ImageNet: A Large-Scale Hierarchical Image Database},
  author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
  booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
  year={2009}
}

نود أن نعرب عن تقديرنا لفريق Stanford لإنشاء والحفاظ على هذا المورد القيم لمجتمع الرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات Dog-Pose ومبتكريها، قم بزيارة موقع Stanford Dogs Dataset.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات Dog-Pose، وكيف يتم استخدامها مع Ultralytics YOLO26؟#

تتميز مجموعة بيانات Dog-Pose بـ 6,773 صورة للتدريب و1,703 صورة للتحقق مع تعليقات توضيحية لـ 24 نقطة رئيسية لتقدير وضعية الكلب. تم تصميمها لتدريب ونماذج التحقق باستخدام Ultralytics YOLO26، مما يدعم تطبيقات مثل تحليل سلوك الحيوانات، ومراقبة الحيوانات الأليفة، والدراسات البيطرية. تجعل التعليقات التوضيحية الشاملة للمجموعة مثالية لتطوير نماذج دقيقة لتقدير وضعية الكلاب.

Link to this sectionكيف أقوم بتدريب نموذج YOLO26 باستخدام مجموعة بيانات Dog-Pose في Ultralytics؟#

قم بتحميل yolo26n-pose.pt واستدعِ model.train(data="dog-pose.yaml", epochs=100, imgsz=640) — راجع مثال التدريب أعلاه للحصول على مقتطفات Python و CLI الكاملة، وصفحة التدريب الخاصة بالنموذج للحصول على قائمة شاملة بالوسيطات.

Link to this sectionما هي فوائد استخدام مجموعة بيانات Dog-Pose؟#

مع إجمالي 8,476 صورة (6,773 للتدريب / 1,703 للتحقق) تغطي مجموعة واسعة من سلالات الكلاب ووضعياتها، و24 نقطة رئيسية في 3 أبعاد (x، y، الرؤية) لكل تعليق توضيحي، تمنح مجموعة بيانات Dog-Pose النماذج تغطية للسيناريوهات الواقعية المطلوبة لتطبيقات مثل مراقبة الحيوانات الأليفة وتحليل السلوك. لمزيد من المعلومات حول ميزاتها واستخدامها، راجع قسم مقدمة مجموعة البيانات.

Link to this sectionكيف يفيد التجميع (mosaicing) عملية تدريب YOLO26 باستخدام مجموعة بيانات Dog-Pose؟#

يعمل التجميع (mosaicing) على دمج صور Dog-Pose متعددة في صورة تدريب واحدة، مما يزيد من تنوع وضعيات الكلاب وأحجامها وخلفياتها التي يراها النموذج في كل خطوة، مما يحسن التعميم على سياقات ومقاييس جديدة مع تقليل الإفراط في التجهيز (overfitting). للاطلاع على صور أمثلة، ارجع إلى قسم صور وأمثلة التعليقات التوضيحية.

Link to this sectionأين يمكنني العثور على ملف YAML الخاص بمجموعة بيانات Dog-Pose وكيف أستخدمه؟#

يمكن العثور على ملف YAML الخاص بمجموعة بيانات Dog-Pose على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml. يحدد هذا الملف تهيئة مجموعة البيانات، بما في ذلك المسارات والفئات وتفاصيل النقاط الرئيسية ومعلومات أخرى ذات صلة. يحدد ملف YAML 24 نقطة رئيسية مع 3 أبعاد لكل نقطة رئيسية، مما يجعله مناسباً لمهام تقدير الوضعية التفصيلية.

لاستخدام هذا الملف مع نصوص تدريب YOLO26، ما عليك سوى الإشارة إليه في أمر التدريب الخاص بك كما هو موضح في قسم الاستخدام. سيتم تنزيل مجموعة البيانات تلقائياً عند استخدامها لأول مرة، مما يجعل الإعداد مباشراً.

لمزيد من المعلومات حول نماذج النقاط المفصلية، راجع مستندات مهمة تقدير الوضعية.

المساهمون

GLglenn-jocher⁹ RAraimbekovm³ RIRizwanMunawar² PDpderrenger¹

تم الإنشاء 16 نوفمبر 2024تم التحديث أول أمس