مجموعة بيانات وضعية الكلب
مقدمة
مجموعة بيانات Ultralytics مجموعة بيانات وضعية الكلب هي مجموعة بيانات عالية الجودة وشاملة تم تنسيقها خصيصًا لتقدير وضعية الكلب. مع وجود 6,773 صورة تدريب و1,703 صورة اختبار، توفر مجموعة البيانات هذه أساسًا متينًا لتدريب نماذج قوية لتقدير الوضعية. تشتمل كل صورة مشروحة على 24 نقطة أساسية مع 3 أبعاد لكل نقطة أساسية (س، ص، رؤية)، مما يجعلها مورداً قيماً للبحث والتطوير المتقدمين في مجال الرؤية الحاسوبية.
مجموعة البيانات هذه مخصصة للاستخدام مع Ultralytics HUB و. YOLO11.
مجموعة البيانات YAML
يُستخدم ملف YAML (لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. وهو يتضمن المسارات وتفاصيل النقاط الرئيسية وغيرها من المعلومات ذات الصلة. في حالة مجموعة بيانات وضعية الكلب، فإن ملف dog-pose.yaml
متاح على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dog-pose.yaml.
ultralytics/cfg/datasets/dog-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# Dogs dataset http://vision.stanford.edu/aditya86/ImageNetDogs/ by Stanford
# Documentation: https://docs.ultralytics.com/datasets/pose/dog-pose/
# Example usage: yolo train data=dog-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dog-pose ← downloads here (337 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dog-pose # dataset root dir
train: train # train images (relative to 'path') 6773 images
val: val # val images (relative to 'path') 1703 images
# Keypoints
kpt_shape: [24, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
# Classes
names:
0: dog
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dog-pose.zip
الاستخدام
لتدريب نموذج YOLO11n-pose على مجموعة بيانات Dog-pose لـ 100 حقبة زمنية بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.
مثال على القطار
عينة من الصور والتعليقات التوضيحية
فيما يلي بعض الأمثلة لصور من مجموعة بيانات وضعية الكلب، إلى جانب التعليقات التوضيحية المقابلة لها:
- صورة فسيفساء: توضح هذه الصورة دفعة تدريب مكونة من صور مجموعة بيانات موزاييك. الفسيفساء هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الأجسام والمشاهد داخل كل دفعة تدريب. يساعد ذلك في تحسين قدرة النموذج على التعميم على أحجام الأجسام المختلفة ونسب أبعادها وسياقاتها.
يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات وضعية الكلب وفوائد استخدام الفسيفساء أثناء عملية التدريب.
الاستشهادات والشكر والتقدير
إذا كنت تستخدم مجموعة بيانات Dog-pose في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة التالية:
@inproceedings{khosla2011fgvc,
title={Novel dataset for Fine-Grained Image Categorization},
author={Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and Li Fei-Fei},
booktitle={First Workshop on Fine-Grained Visual Categorization (FGVC), IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2011}
}
@inproceedings{deng2009imagenet,
title={ImageNet: A Large-Scale Hierarchical Image Database},
author={Jia Deng and Wei Dong and Richard Socher and Li-Jia Li and Kai Li and Li Fei-Fei},
booktitle={IEEE Computer Vision and Pattern Recognition (CVPR)},
year={2009}
}
نود أن نشكر فريق ستانفورد على إنشاء هذا المورد القيّم لمجتمع الرؤية الحاسوبية والحفاظ عليه. للمزيد من المعلومات حول مجموعة بيانات وضعية الكلب ومنشئيها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات كلاب ستانفورد.
الأسئلة الشائعة
ما هي مجموعة بيانات وضعية الكلب، وكيف يتم استخدامها مع Ultralytics YOLO11 ؟
تتميز مجموعة بيانات وضعية الكلب بـ 6,000 صورة مشروحة بـ 17 نقطة أساسية لتقدير وضعية الكلب. مثالية لتدريب النماذج والتحقق من صحتها باستخدام Ultralytics YOLO11وتدعم تطبيقات مثل تحليل سلوك الحيوان والدراسات البيطرية.
كيف أقوم بتدريب نموذج YOLO11 باستخدام مجموعة بيانات وضعية الكلب في Ultralytics ؟
لتدريب نموذج YOLO11n-pose على مجموعة بيانات وضعية الكلب لـ 100 حلقة تدريبية بحجم صورة 640، اتبع هذه الأمثلة:
مثال على القطار
للحصول على قائمة شاملة بحجج التدريب، راجع صفحة التدريب النموذجي.
ما هي فوائد استخدام مجموعة بيانات وضعية الكلب؟
تقدم مجموعة بيانات وضعية الكلب العديد من الفوائد:
مجموعة بيانات كبيرة ومتنوعة: مع وجود 6,000 صورة، فإنها توفر كمية كبيرة من البيانات التي تغطي مجموعة واسعة من أوضاع الكلاب وسلالاتها وسياقاتها، مما يتيح تدريب وتقييم نموذج قوي.
شروح خاصة بالوضعية: تقدم شروحًا تفصيلية لتقدير الوضعية، مما يضمن بيانات عالية الجودة لتدريب نماذج اكتشاف الوضعيات.
سيناريوهات العالم الحقيقي: يتضمن صوراً من بيئات متنوعة، مما يعزز قدرة النموذج على التعميم على تطبيقات العالم الحقيقي.
تحسين أداء النموذج: يساعد تنوّع مجموعة البيانات وحجمها على تحسين دقة النموذج ومتانته، خاصةً بالنسبة للمهام التي تنطوي على تقدير دقيق للوضعية.
لمعرفة المزيد حول ميزاته واستخداماته، راجع قسم مقدمة مجموعة البيانات.
كيف تفيد الفسيفساء في عملية التدريب YOLO11 باستخدام مجموعة بيانات وضعية الكلب؟
يدمج الفسيفساء، كما هو موضح في عينة الصور من مجموعة بيانات وضعية الكلب، صورًا متعددة في صورة مركبة واحدة، مما يثري تنوع الأجسام والمشاهد في كل دفعة تدريب. يعمل هذا النهج على تعزيز قدرة النموذج على التعميم عبر مختلف أحجام الأجسام ونسب العرض إلى الارتفاع والسياقات المختلفة، مما يؤدي إلى تحسين الأداء. للحصول على أمثلة للصور، راجع قسم عينة الصور والتعليقات التوضيحية.
أين يمكنني العثور على ملف YAML الخاص بمجموعة بيانات وضع الكلب وكيف يمكنني استخدامه؟
يمكن العثور على ملف YAML الخاص بمجموعة بيانات Dog-pose هنا. يحدد هذا الملف تكوين مجموعة البيانات، بما في ذلك المسارات والفئات والمعلومات الأخرى ذات الصلة. استخدم هذا الملف مع البرامج النصية للتدريب YOLO11 كما هو مذكور في قسم مثال التدريب.
للمزيد من الأسئلة الشائعة والوثائق التفصيلية، يرجى زيارة الموقع الإلكتروني Ultralytics Documentation.