تخطي إلى المحتوى

مجموعة بيانات النقاط الرئيسية اليدوية

مقدمة

تحتوي مجموعة بيانات نقاط المفاتيح اليدوية على 26,768 صورة لليدين مشروحة بنقاط مفاتيح، مما يجعلها مناسبة لنماذج التدريب مثل Ultralytics YOLO لمهام تقدير الوضعية. وقد تم إنشاء التعليقات التوضيحية باستخدام مكتبة Google MediaPipe، مما يضمن دقة واتساقًا عاليين، كما أن مجموعة البيانات متوافقة مع Ultralytics YOLO11 التنسيقات.



شاهد: تقدير النقاط الرئيسية لليد باستخدام Ultralytics YOLO11 | البرنامج التعليمي لتقدير وضعية اليد البشرية

معالم اليد

معالم اليد

النقاط الرئيسية

تتضمن مجموعة البيانات نقاطاً رئيسية للكشف عن اليد. يتم شرح النقاط الرئيسية على النحو التالي:

  1. المعصم
  2. الإبهام (4 نقاط)
  3. السبابة (4 نقاط)
  4. الإصبع الوسطى (4 نقاط)
  5. إصبع الخاتم (4 نقاط)
  6. الإصبع الصغير (4 نقاط)

تحتوي كل يد على إجمالي 21 نقطة أساسية.

الميزات الرئيسية

  • مجموعة بيانات كبيرة: 26,768 صورة مع تعليقات توضيحية يدوية للنقاط الرئيسية.
  • YOLO11 التوافق: جاهز للاستخدام مع الطرازات YOLO11 .
  • 21 نقطة أساسية: تمثيل مفصل لوضعية اليد.

هيكلية مجموعة البيانات

تنقسم مجموعة بيانات النقاط الرئيسية اليدوية إلى مجموعتين فرعيتين:

  1. تدريب: تحتوي هذه المجموعة الفرعية على 18,776 صورة من مجموعة بيانات النقاط الرئيسية لليدين، مشروحة لتدريب نماذج تقدير الوضعية.
  2. Val: تحتوي هذه المجموعة الفرعية على 7992 صورة يمكن استخدامها لأغراض التحقق من الصحة أثناء تدريب النموذج.

التطبيقات

يمكن استخدام نقاط المفاتيح اليدوية للتعرف على الإيماءات، وأدوات التحكم في الواقع المعزز/الواقع الافتراضي، والمعالجة الروبوتية، وتحليل حركة اليد في مجال الرعاية الصحية. كما يمكن تطبيقها أيضاً في الرسوم المتحركة لالتقاط الحركة وأنظمة المصادقة البيومترية للأمان.

مجموعة البيانات YAML

يُستخدم ملف YAML (لغة ترميز أخرى) لتعريف تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات وفئاتها والمعلومات الأخرى ذات الصلة. في حالة مجموعة بيانات نقاط المفتاح اليدوية، فإن ملف hand-keypoints.yaml يتم الاحتفاظ بالملف في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/hand-keypoints.yaml.

ultralytics/cfg/datasets/hand-keypoints.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Hand Keypoints dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/hand-keypoints/
# Example usage: yolo train data=hand-keypoints.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── hand-keypoints  ← downloads here (369 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/hand-keypoints # dataset root dir
train: train # train images (relative to 'path') 18776 images
val: val # val images (relative to 'path') 7992 images

# Keypoints
kpt_shape: [21, 3] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx:
  [0, 1, 2, 4, 3, 10, 11, 12, 13, 14, 5, 6, 7, 8, 9, 15, 16, 17, 18, 19, 20]

# Classes
names:
  0: hand

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/hand-keypoints.zip

الاستخدام

لتدريب نموذج YOLO11n-pose على مجموعة بيانات نقاط المفتاح اليدوية لـ 100 حلقة تدريبية بحجم صورة 640، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.

مثال على القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات النقاط الرئيسية لليد على مجموعة متنوعة من الصور ذات الأيدي البشرية المشروحة بنقاط رئيسية. فيما يلي بعض الأمثلة لصور من مجموعة البيانات، إلى جانب التعليقات التوضيحية المقابلة لها:

صورة عينة مجموعة البيانات

  • صورة فسيفساء: توضح هذه الصورة دفعة تدريب مكونة من صور مجموعة بيانات موزاييك. الفسيفساء هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الأجسام والمشاهد داخل كل دفعة تدريب. يساعد ذلك في تحسين قدرة النموذج على التعميم على أحجام الأجسام المختلفة ونسب أبعادها وسياقاتها.

يعرض هذا المثال تنوع الصور وتعقيدها في مجموعة بيانات Hand Keypoints وفوائد استخدام الفسيفساء أثناء عملية التدريب.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات نقاط المفاتيح اليدوية في عملك البحثي أو التطويري، يُرجى الإقرار بالمصادر التالية:

نود أن نشكر المصادر التالية على توفير الصور المستخدمة في مجموعة البيانات هذه:

جُمعت الصور واستخدمت بموجب التراخيص الخاصة بكل منصة، وهي موزعة بموجب رخصة المشاع الإبداعي نَسب المُصنَّف - غير تجاري - بالمثل 4.0 دولي.

نود أيضًا أن نشكر مبتكر مجموعة البيانات هذه، ريون دسيلفا، على مساهمته الكبيرة في أبحاث الذكاء الاصطناعي البصري.

الأسئلة الشائعة

كيف أقوم بتدريب نموذج YOLO11 على مجموعة بيانات نقاط المفتاح اليدوية؟

لتدريب نموذج YOLO11 على مجموعة بيانات Hand Keypoints، يمكنك استخدام إما Python أو واجهة سطر الأوامر (CLI). فيما يلي مثال لتدريب نموذج YOLO11n-pose لـ 100 حقبة زمنية بحجم صورة 640:

مثال على ذلك

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="hand-keypoints.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo pose train data=hand-keypoints.yaml model=yolo11n-pose.pt epochs=100 imgsz=640

للاطلاع على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب النموذجي.

ما هي السمات الرئيسية لمجموعة بيانات النقاط الرئيسية لليد؟

صُممت مجموعة بيانات Hand Keypoints لمهام تقدير الوضعية المتقدمة وتتضمن العديد من الميزات الرئيسية:

  • مجموعة بيانات كبيرة: تحتوي على 26,768 صورة مع تعليقات توضيحية يدوية للنقاط الرئيسية.
  • YOLO11 التوافق: جاهز للاستخدام مع الطرازات YOLO11 .
  • 21 نقطة رئيسية: تمثيل مفصل لوضع اليد، بما في ذلك مفاصل الرسغ والأصابع.

لمزيد من التفاصيل، يمكنك استكشاف قسم مجموعة بيانات النقاط الرئيسية اليدوية.

ما هي التطبيقات التي يمكن أن تستفيد من استخدام مجموعة بيانات النقاط الرئيسية اليدوية؟

يمكن تطبيق مجموعة بيانات النقاط الرئيسية اليدوية في مختلف المجالات، بما في ذلك:

  • التعرّف على الإيماءات: تعزيز التفاعل بين الإنسان والحاسوب.
  • ضوابط الواقع المعزز/الواقع الافتراضي: تحسين تجربة المستخدم في الواقع المعزز والواقع الافتراضي.
  • المعالجة الروبوتية: تمكين التحكم الدقيق في الأيدي الروبوتية.
  • الرعاية الصحية: تحليل حركات اليد للتشخيص الطبي.
  • الرسوم المتحركة: التقاط الحركة للرسوم المتحركة الواقعية.
  • المصادقة البيومترية: تعزيز أنظمة الأمان.

لمزيد من المعلومات، راجع قسم التطبيقات.

كيف يتم تنظيم مجموعة بيانات النقاط الرئيسية اليدوية؟

تنقسم مجموعة بيانات النقاط الرئيسية اليدوية إلى مجموعتين فرعيتين:

  1. تدريب: يحتوي على 18,776 صورة لتدريب نماذج تقدير الوضعية.
  2. Val: يحتوي على 7,992 صورة لأغراض التحقق من الصحة أثناء تدريب النموذج.

يضمن هذا الهيكل عملية تدريب وتحقق شاملة. لمزيد من التفاصيل، راجع قسم بنية مجموعة البيانات.

كيف يمكنني استخدام ملف مجموعة البيانات YAML للتدريب؟

يتم تعريف تكوين مجموعة البيانات في ملف YAML، والذي يتضمن مسارات وفئات ومعلومات أخرى ذات صلة. يتم تعريف hand-keypoints.yaml يمكن العثور على الملف على نقاط المفاتيح اليدوية.yaml.

لاستخدام ملف YAML هذا للتدريب، حدده في البرنامج النصي للتدريب أو الأمر CLI كما هو موضح في مثال التدريب أعلاه. لمزيد من التفاصيل، راجع قسم مجموعة البيانات YAML.

📅 تم إنشاؤها قبل 3 أشهر ✏️ تم التحديث منذ 1 شهر

التعليقات