مجموعة بيانات COCO-Pose Dataset
إن مجموعة بيانات COCO-Pose هي نسخة متخصصة من مجموعة بيانات COCO (كائنات مشتركة في السياق)، وهي مصممة لمهام تقدير الوضعية. وهي تستفيد من صور وتسميات COCO Keypoints 2017 لتمكين تدريب نماذج مثل YOLO لمهام تقدير الوضعية.
نماذج COCO-Pose المدربة مسبقاً
الطراز | الحجم (بكسل) |
mAPpose 50-95 |
mAPpose 50 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|---|
YOLO11n-pose | 640 | 50.0 | 81.0 | 52.4 ± 0.5 | 1.7 ± 0.0 | 2.9 | 7.6 |
YOLO11s-pose | 640 | 58.9 | 86.3 | 90.5 ± 0.6 | 2.6 ± 0.0 | 9.9 | 23.2 |
YOLO11m-pose | 640 | 64.9 | 89.4 | 187.3 ± 0.8 | 4.9 ± 0.1 | 20.9 | 71.7 |
YOLO11l-pose | 640 | 66.1 | 89.9 | 247.7 ± 1.1 | 6.4 ± 0.1 | 26.2 | 90.7 |
YOLO11x-بوز | 640 | 69.5 | 91.1 | 488.0 ± 13.9 | 12.1 ± 0.2 | 58.8 | 203.3 |
الميزات الرئيسية
- يعتمد برنامج COCO-Pose على مجموعة بيانات COCO Keypoints 2017 التي تحتوي على 200 ألف صورة موسومة بنقاط أساسية لمهام تقدير الوضعية.
- تدعم مجموعة البيانات 17 نقطة رئيسية للأشكال البشرية، مما يسهل تقدير الوضعية التفصيلية.
- ومثله مثل COCO، يوفر مقاييس تقييم موحدة، بما في ذلك تشابه نقاط الكائنات الرئيسية (OKS) لمهام تقدير الوضعية، مما يجعله مناسبًا لمقارنة أداء النموذج.
هيكلية مجموعة البيانات
تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:
- تدريب 2017: تحتوي هذه المجموعة الفرعية على جزء من 118 ألف صورة من مجموعة بيانات COCO، مشروحة لتدريب نماذج تقدير الوضعيات.
- Val2017: تحتوي هذه المجموعة الفرعية على مجموعة مختارة من الصور المستخدمة لأغراض التحقق من الصحة أثناء تدريب النموذج.
- اختبار2017: تتكون هذه المجموعة الفرعية من الصور المستخدمة لاختبار وقياس النماذج المدربة. لا تتوفر شروح الحقيقة الأساسية لهذه المجموعة الفرعية للجمهور، ويتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.
التطبيقات
تُستخدم مجموعة بيانات COCO-Pose خصيصًا لتدريب وتقييم نماذج التعلّم العميق في مهام اكتشاف النقاط الرئيسية وتقدير الوضعية، مثل OpenPose. إن العدد الكبير من الصور المشروحة في مجموعة البيانات ومقاييس التقييم الموحدة تجعلها موردًا أساسيًا للباحثين والممارسين في مجال الرؤية الحاسوبية الذين يركزون على تقدير الوضعية.
مجموعة البيانات YAML
يُستخدم ملف YAML (لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات وفئاتها والمعلومات الأخرى ذات الصلة. في حالة مجموعة بيانات COCO-Pose، فإن ملف coco-pose.yaml
يتم الاحتفاظ بالملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco-pose.yaml.
ultralytics/cfg/datasets/coco-pose.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO 2017 dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/pose/coco/
# Example usage: yolo train data=coco-pose.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco-pose ← downloads here (20.1 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco-pose # dataset root dir
train: train2017.txt # train images (relative to 'path') 118287 images
val: val2017.txt # val images (relative to 'path') 5000 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://competitions.codalab.org/competitions/20794
# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]
# Classes
names:
0: person
# Download script/URL (optional)
download: |
from ultralytics.utils.downloads import download
from pathlib import Path
# Download labels
dir = Path(yaml['path']) # dataset root dir
url = 'https://github.com/ultralytics/assets/releases/download/v0.0.0/'
urls = [url + 'coco2017labels-pose.zip'] # labels
download(urls, dir=dir.parent)
# Download data
urls = ['http://images.cocodataset.org/zips/train2017.zip', # 19G, 118k images
'http://images.cocodataset.org/zips/val2017.zip', # 1G, 5k images
'http://images.cocodataset.org/zips/test2017.zip'] # 7G, 41k images (optional)
download(urls, dir=dir / 'images', threads=3)
الاستخدام
لتدريب نموذج YOLO11n-pose على مجموعة بيانات COCO-Pose لـ 100 حقبة زمنية بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.
مثال على القطار
عينة من الصور والتعليقات التوضيحية
تحتوي مجموعة بيانات COCO-Pose على مجموعة متنوعة من الصور ذات الأشكال البشرية المشروحة بنقاط رئيسية. فيما يلي بعض الأمثلة لصور من مجموعة البيانات، إلى جانب التعليقات التوضيحية المقابلة لها:
- صورة فسيفساء: توضح هذه الصورة دفعة تدريب مكونة من صور مجموعة بيانات موزاييك. الفسيفساء هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الأجسام والمشاهد داخل كل دفعة تدريب. يساعد ذلك في تحسين قدرة النموذج على التعميم على أحجام الأجسام المختلفة ونسب أبعادها وسياقاتها.
يعرض هذا المثال تنوع وتعقيد الصور في مجموعة بيانات COCO-Pasas وفوائد استخدام الفسيفساء أثناء عملية التدريب.
الاستشهادات والشكر والتقدير
إذا كنت تستخدم مجموعة بيانات COCO-Passe في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة التالية:
@misc{lin2015microsoft,
title={Microsoft COCO: Common Objects in Context},
author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
year={2015},
eprint={1405.0312},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
نود أن نعرب عن تقديرنا لاتحاد COCO Consortium على إنشاء هذا المورد القيّم لمجتمع الرؤية الحاسوبية والحفاظ عليه. لمزيد من المعلومات حول مجموعة بيانات COCO-Pasaset ومنشئيها، يرجى زيارة الموقع الإلكتروني لمجموعة بيانات COCO.
الأسئلة الشائعة
ما هي مجموعة بيانات COCO-Pose وكيف يتم استخدامها مع Ultralytics YOLO لتقدير الوضعية؟
إن مجموعة بيانات COCO-Pose هي نسخة متخصصة من مجموعة بيانات COCO (كائنات مشتركة في السياق) مصممة لمهام تقدير الوضعية. وهي تعتمد على صور COCO Keypoints 2017 وشروحها، مما يسمح بتدريب نماذج مثل Ultralytics YOLO لتقدير الوضعية التفصيلية. على سبيل المثال، يمكنك استخدام مجموعة بيانات COCO-Pasose لتدريب نموذج YOLO11n-pose من خلال تحميل نموذج مُدرَّب مسبقًا وتدريبه باستخدام تكوين YAML. للاطلاع على أمثلة التدريب، راجع وثائق التدريب.
كيف يمكنني تدريب نموذج YOLO11 على مجموعة بيانات COCO-Pasas؟
يمكن تدريب نموذج YOLO11 على مجموعة بيانات COCO-Passe باستخدام الأمرين Python أو CLI . على سبيل المثال، لتدريب نموذج YOLO11n-pose لـ 100 حقبة زمنية بحجم صورة 640، يمكنك اتباع الخطوات التالية:
مثال على القطار
لمزيد من التفاصيل حول عملية التدريب والحجج المتاحة، راجع صفحة التدريب.
ما هي المقاييس المختلفة التي توفرها مجموعة بيانات COCO-Passe لتقييم أداء النموذج؟
توفر مجموعة بيانات COCO-Pose العديد من مقاييس التقييم الموحدة لمهام تقدير الوضع، على غرار مجموعة بيانات COCO الأصلية. تتضمن المقاييس الرئيسية تشابه النقاط الرئيسية للكائنات (OKS)، والتي تقيّم دقة النقاط الرئيسية المتوقعة مقابل التعليقات التوضيحية للحقيقة الأرضية. تسمح هذه المقاييس بإجراء مقارنات شاملة للأداء بين النماذج المختلفة. على سبيل المثال، نماذج COCO-Pose المدربة مسبقًا مثل YOLO11n-pose و YOLO11s-pose وغيرها لديها مقاييس أداء محددة مدرجة في الوثائق، مثل mAPpose50-95و mAPpose50.
كيف يتم تنظيم مجموعة البيانات وتقسيمها لمجموعة بيانات COCO-Pose؟
تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:
- تدريب 2017: يحتوي على جزء من صور COCO البالغ عددها 118 ألف صورة، مشروحة لتدريب نماذج تقدير الوضعية.
- Val2017: صور مختارة لأغراض التحقق من الصحة أثناء تدريب النموذج.
- اختبار2017: الصور المستخدمة لاختبار وقياس النماذج المدربة. شروح الحقيقة الأساسية لهذه المجموعة الفرعية غير متاحة للجمهور؛ يتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.
تساعد هذه المجموعات الفرعية في تنظيم مراحل التدريب والتحقق من الصحة والاختبار بفعالية. للحصول على تفاصيل التكوين، استكشف coco-pose.yaml
الملف متاح على جيثب.
ما هي الميزات والتطبيقات الرئيسية لمجموعة بيانات COCO-Passe؟
تعمل مجموعة بيانات COCO-Pose على توسيع نطاق شروح COCO Keypoints 2017 لتشمل 17 نقطة رئيسية للأشكال البشرية، مما يتيح تقدير الوضعية التفصيلية. تسهل مقاييس التقييم الموحدة (على سبيل المثال، OKS) إجراء مقارنات بين النماذج المختلفة. تشمل تطبيقات مجموعة بيانات COCO-Pasose مجالات مختلفة، مثل التحليلات الرياضية والرعاية الصحية والتفاعل بين الإنسان والحاسوب، حيثما يتطلب الأمر تقدير الوضعية التفصيلية للأشكال البشرية. وللاستخدام العملي، يمكن للاستفادة من النماذج المدربة مسبقًا مثل تلك المتوفرة في الوثائق (على سبيل المثال، YOLO11n-pose) أن تبسط العملية بشكل كبير(الميزات الرئيسية).
إذا كنت تستخدم مجموعة بيانات COCO-Passe في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية مع إدخال BibTeX التالي.