Meet YOLO26: next-gen vision AI.

Link to this sectionمجموعة بيانات COCO-Pose#

تعد مجموعة بيانات COCO-Pose نسخة متخصصة من مجموعة بيانات COCO (الأشياء الشائعة في السياق)، مصممة لمهام تقدير الوضعية. وهي تستفيد من صور وتسميات COCO Keypoints 2017 لتمكين تدريب نماذج مثل YOLO لمهام تقدير الوضعية.

تقدير وضعية COCO مع النقاط الرئيسية البشرية

Link to this sectionنماذج COCO-Pose المدربة مسبقًا#

النموذجالحجم
(بكسل)
mAPpose
50-95(e2e)
mAPpose
50(e2e)
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLO26n-pose64057.283.340.3 ± 0.51.8 ± 0.02.97.5
YOLO26s-pose64063.086.685.3 ± 0.92.7 ± 0.010.423.9
YOLO26m-pose64068.889.6218.0 ± 1.55.0 ± 0.121.573.1
YOLO26l-pose64070.490.5275.4 ± 2.46.5 ± 0.125.991.3
YOLO26x-pose64071.691.6565.4 ± 3.012.2 ± 0.257.6201.7

Link to this sectionالميزات الرئيسية#

  • تعتمد COCO-Pose على مجموعة بيانات COCO Keypoints 2017 التي تحتوي على 200 ألف صورة موسومة بنقاط رئيسية لمهام تقدير الوضعية.
  • تدعم مجموعة البيانات 17 نقطة رئيسية للشخصيات البشرية، مما يسهل تقدير الوضعية المفصل.
  • مثل COCO، توفر مقاييس تقييم موحدة، بما في ذلك تشابه النقاط الرئيسية للكائنات (OKS) لمهام تقدير الوضعية، مما يجعلها مناسبة لمقارنة أداء النماذج.

Link to this sectionهيكل مجموعة البيانات#

تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:

  1. Train2017: تحتوي هذه المجموعة الفرعية على 56599 صورة من مجموعة بيانات COCO، مع تعليقات توضيحية لتدريب نماذج تقدير الوضعية.
  2. Val2017: تحتوي هذه المجموعة الفرعية على 2346 صورة تستخدم لأغراض التحقق أثناء تدريب النموذج.
  3. Test2017: يتكون هذا الجزء الفرعي من صور تُستخدم لاختبار وتقييم النماذج المدربة. لا تتوفر التعليقات التوضيحية للحقيقة الأساسية (ground truth) لهذا الجزء الفرعي للجمهور، ويتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.

Link to this sectionالتطبيقات#

تستخدم مجموعة بيانات COCO-Pose خصيصًا لتدريب وتقييم نماذج التعلم العميق في مهام اكتشاف النقاط الرئيسية وتقدير الوضعية، مثل OpenPose. إن العدد الكبير من الصور الموسومة ومقاييس التقييم الموحدة في مجموعة البيانات يجعلها موردًا أساسيًا للباحثين والممارسين في رؤية الحاسوب الذين يركزون على تقدير الوضعية.

Link to this sectionYAML مجموعة البيانات#

يتم استخدام ملف YAML (لغة ترميز أخرى) لتحديد تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، ومعلومات أخرى ذات صلة. في حالة مجموعة بيانات COCO-Pose، يتم الاحتفاظ بملف coco-pose.yaml في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/coco-pose.yaml.

ultralytics/cfg/datasets/coco-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO 2017 Keypoints dataset https://cocodataset.org by Microsoft
# Documentation: https://docs.ultralytics.com/datasets/pose/coco
# Example usage: yolo train data=coco-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco-pose ← downloads here (20.1 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco-pose # dataset root dir
train: train2017.txt # train images (relative to 'path') 56599 images
val: val2017.txt # val images (relative to 'path') 2346 images
test: test-dev2017.txt # 20288 of 40670 images, submit to https://codalab.lisn.upsaclay.fr/competitions/7403

# Keypoints
kpt_shape: [17, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# Classes
names:
  0: person

# Keypoint names per class
kpt_names:
  0:
    - nose
    - left_eye
    - right_eye
    - left_ear
    - right_ear
    - left_shoulder
    - right_shoulder
    - left_elbow
    - right_elbow
    - left_wrist
    - right_wrist
    - left_hip
    - right_hip
    - left_knee
    - right_knee
    - left_ankle
    - right_ankle

# Download script/URL (optional)
download: |
  from pathlib import Path

  from ultralytics.utils import ASSETS_URL
  from ultralytics.utils.downloads import download

  # Download labels
  dir = Path(yaml["path"])  # dataset root dir

  urls = [f"{ASSETS_URL}/coco2017labels-pose.zip"]
  download(urls, dir=dir.parent)
  # Download data
  urls = [
      "http://images.cocodataset.org/zips/train2017.zip",  # 19G, 118k images
      "http://images.cocodataset.org/zips/val2017.zip",  # 1G, 5k images
      "http://images.cocodataset.org/zips/test2017.zip",  # 7G, 41k images (optional)
  ]
  download(urls, dir=dir / "images", threads=3)

Link to this sectionالاستخدام#

لتدريب نموذج YOLO26n-pose على مجموعة بيانات COCO-Pose لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)

Link to this sectionصور وشروحات توضيحية عينة#

تحتوي مجموعة بيانات COCO-Pose على مجموعة متنوعة من الصور مع شخصيات بشرية موسومة بنقاط رئيسية. إليك بعض الأمثلة على الصور من مجموعة البيانات، جنبًا إلى جنب مع التعليقات التوضيحية المقابلة لها:

دفعة تدريب موزاييك لتقدير وضعية COCO

  • صورة مجمعة (Mosaiced Image): توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات مجمعة. الفسيفساء (Mosaicing) هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات COCO-Pose وفوائد استخدام الموزاييك أثناء عملية التدريب.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات COCO-Pose في بحثك أو عملك التطويري، فيرجى الاستشهاد بالورقة التالية:

اقتباس
@misc{lin2015microsoft,
      title={Microsoft COCO: Common Objects in Context},
      author={Tsung-Yi Lin and Michael Maire and Serge Belongie and Lubomir Bourdev and Ross Girshick and James Hays and Pietro Perona and Deva Ramanan and C. Lawrence Zitnick and Piotr Dollár},
      year={2015},
      eprint={1405.0312},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

نود أن نشكر اتحاد COCO لإنشاء والحفاظ على هذا المورد القيم لمجتمع رؤية الحاسوب. لمزيد من المعلومات حول مجموعة بيانات COCO-Pose ومبتكريها، تفضل بزيارة موقع مجموعة بيانات COCO.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات COCO-Pose وكيف يتم استخدامها مع Ultralytics YOLO لتقدير الوضعية؟#

تعد مجموعة بيانات COCO-Pose نسخة متخصصة من مجموعة بيانات COCO (الأشياء الشائعة في السياق) مصممة لمهام تقدير الوضعية. وهي تعتمد على صور وتعليقات COCO Keypoints 2017، مما يسمح بتدريب نماذج مثل Ultralytics YOLO لتقدير الوضعية المفصل. على سبيل المثال، يمكنك استخدام مجموعة بيانات COCO-Pose لتدريب نموذج YOLO26n-pose عن طريق تحميل نموذج مدرب مسبقًا وتدريبه باستخدام تكوين YAML. للحصول على أمثلة التدريب، راجع وثائق التدريب.

Link to this sectionكيف يمكنني تدريب نموذج YOLO26 على مجموعة بيانات COCO-Pose؟#

يمكن إنجاز تدريب نموذج YOLO26 على مجموعة بيانات COCO-Pose باستخدام Python أو أوامر CLI. على سبيل المثال، لتدريب نموذج YOLO26n-pose لمدة 100 حقبة بحجم صورة 640، يمكنك اتباع الخطوات أدناه:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco-pose.yaml", epochs=100, imgsz=640)

لمزيد من التفاصيل حول عملية التدريب والوسيطات المتاحة، تحقق من صفحة التدريب.

Link to this sectionما هي المقاييس المختلفة التي توفرها مجموعة بيانات COCO-Pose لتقييم أداء النموذج؟#

توفر مجموعة بيانات COCO-Pose العديد من مقاييس التقييم الموحدة لمهام تقدير الوضعية، على غرار مجموعة بيانات COCO الأصلية. تشمل المقاييس الرئيسية تشابه النقاط الرئيسية للكائنات (OKS)، الذي يقيم الدقة للنقاط الرئيسية المتوقعة مقابل تعليقات الحقيقة الأرضية. تسمح هذه المقاييس بإجراء مقارنات أداء شاملة بين نماذج مختلفة. على سبيل المثال، النماذج المدربة مسبقًا لـ COCO-Pose مثل YOLO26n-pose وYOLO26s-pose وغيرها لديها مقاييس أداء محددة مدرجة في الوثائق، مثل mAPpose50-95 و mAPpose50.

Link to this sectionكيف يتم تنظيم وتقسيم مجموعة بيانات COCO-Pose؟#

تنقسم مجموعة بيانات COCO-Pose إلى ثلاث مجموعات فرعية:

  1. Train2017: تحتوي على 56599 صورة من COCO، موسومة لتدريب نماذج تقدير الوضعية.
  2. Val2017: 2346 صورة لأغراض التحقق أثناء تدريب النموذج.
  3. Test2017: صور تُستخدم لاختبار وتقييم النماذج المدربة. لا تتوفر التعليقات التوضيحية للحقيقة الأساسية (ground truth) لهذا الجزء الفرعي للجمهور؛ ويتم إرسال النتائج إلى خادم تقييم COCO لتقييم الأداء.

تساعد هذه المجموعات الفرعية في تنظيم مراحل التدريب والتحقق والاختبار بفعالية. للحصول على تفاصيل التكوين، استكشف ملف coco-pose.yaml المتاح على GitHub.

Link to this sectionما هي السمات والتطبيقات الرئيسية لمجموعة بيانات COCO-Pose؟#

توسع مجموعة بيانات COCO-Pose تعليقات COCO Keypoints 2017 لتشمل 17 نقطة رئيسية للشخصيات البشرية، مما يتيح تقدير وضعية مفصل. تسهل مقاييس التقييم الموحدة (مثل OKS) المقارنات عبر نماذج مختلفة. تمتد تطبيقات مجموعة بيانات COCO-Pose عبر مجالات متنوعة، مثل تحليلات الرياضة، والرعاية الصحية، والتفاعل بين الإنسان والحاسوب، أينما كان تقدير الوضعية المفصل للشخصيات البشرية مطلوبًا. للاستخدام العملي، الاستفادة من النماذج المدربة مسبقًا مثل تلك المقدمة في الوثائق (مثل YOLO26n-pose) يمكن أن تبسط العملية بشكل كبير (الميزات الرئيسية).

إذا كنت تستخدم مجموعة بيانات COCO-Pose في بحثك أو عملك التطويري، فيرجى الاستشهاد بالورقة مع إدخال BibTeX التالي.

التعليقات