مجموعة بيانات Tiger-Pose

مقدمة

تقدم Ultralytics مجموعة بيانات Tiger-Pose، وهي مجموعة متنوعة مصممة لمهام تقدير الوضعية (pose estimation). تتكون مجموعة البيانات هذه من 263 صورة مستمدة من فيديو YouTube، مع تخصيص 210 صور للتدريب و53 للتحقق. وهي بمثابة مورد ممتاز لاختبار واستكشاف أخطاء خوارزميات تقدير الوضعية وإصلاحها.

على الرغم من حجم مجموعة التدريب المعتدل البالغ 210 صور، توفر مجموعة بيانات Tiger-Pose تنوعًا يجعلها مناسبة لتقييم خطوط أنابيب التدريب، وتحديد الأخطاء المحتملة، وتكون بمثابة خطوة أولية قيمة قبل العمل مع مجموعات بيانات أكبر لمهام تقدير الوضعية.

تم تصميم مجموعة البيانات هذه للاستخدام مع منصة Ultralytics و YOLO26.

هيكل مجموعة البيانات

  • إجمالي الصور: 263 (210 للتدريب / 53 للتحقق).
  • النقاط الرئيسية (Keypoints): 12 نقطة لكل نمر (بدون علامة رؤية).
  • تخطيط الدليل: نقاط رئيسية بتنسيق YOLO مخزنة ضمن labels/{train,val} بجانب أدلة images/{train,val}.


Watch: Train YOLO26 Pose Model on Tiger-Pose Dataset Using Ultralytics Platform

ملف YAML الخاص بمجموعة البيانات

يُستخدم ملف YAML (Yet Another Markup Language) كوسيلة لتحديد تفاصيل تهيئة مجموعة البيانات. وهو يشتمل على بيانات حاسمة مثل مسارات الملفات، وتعريفات الفئات، وغيرها من المعلومات ذات الصلة. وبالتحديد، بالنسبة لملف tiger-pose.yaml، يمكنك مراجعة ملف تهيئة مجموعة بيانات Ultralytics Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose ← downloads here (49.8 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: tiger-pose # dataset root dir
train: images/train # train images (relative to 'path') 210 images
val: images/val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Keypoint names per class
kpt_names:
  0:
    - nose
    - head
    - withers
    - tail_base
    - right_hind_hock
    - right_hind_paw
    - left_hind_paw
    - left_hind_hock
    - right_front_wrist
    - right_front_paw
    - left_front_wrist
    - left_front_paw

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/tiger-pose.zip

الاستخدام

لتدريب نموذج YOLO26n-pose على مجموعة بيانات Tiger-Pose لمدة 100 عصر (epoch) بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

صور وعينات تعليقات توضيحية

فيما يلي بعض الأمثلة لصور من مجموعة بيانات Tiger-Pose، إلى جانب تعليقاتها التوضيحية المقابلة:

Tiger pose estimation dataset mosaic training batch
  • صورة فسيفسائية: توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات فسيفسائية. التفسيفس هو تقنية تُستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الأشياء والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم عبر أحجام أشياء ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات Tiger-Pose وفوائد استخدام تقنية الفسيفساء (mosaicing) أثناء عملية التدريب.

مثال على الاستدلال

مثال على الاستدلال
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

الاقتباسات والشكر

تم إصدار مجموعة البيانات بموجب رخصة AGPL-3.0.

الأسئلة الشائعة

ما الغرض من استخدام مجموعة بيانات Ultralytics Tiger-Pose؟

صُممت مجموعة بيانات Ultralytics Tiger-Pose لمهام تقدير الوضعية، وهي تتكون من 263 صورة مستمدة من فيديو YouTube. تنقسم مجموعة البيانات إلى 210 صور للتدريب و53 صورة للتحقق. وهي مفيدة بشكل خاص لاختبار وتدريب وتحسين خوارزميات تقدير الوضعية باستخدام منصة Ultralytics وYOLO26.

كيف يمكنني تدريب نموذج YOLO26 على مجموعة بيانات Tiger-Pose؟

لتدريب نموذج YOLO26n-pose على مجموعة بيانات Tiger-Pose لمدة 100 عصر بحجم صورة 640، استخدم مقتطفات الكود التالية. لمزيد من التفاصيل، تفضل بزيارة صفحة التدريب:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

ما هي الإعدادات التي يتضمنها ملف tiger-pose.yaml؟

يُستخدم ملف tiger-pose.yaml لتحديد تفاصيل تهيئة مجموعة بيانات Tiger-Pose. وهو يتضمن بيانات حاسمة مثل مسارات الملفات وتعريفات الفئات. لمعرفة الإعدادات الدقيقة، يمكنك الاطلاع على ملف تهيئة مجموعة بيانات Ultralytics Tiger-Pose.

كيف يمكنني تشغيل الاستنتاج (inference) باستخدام نموذج YOLO26 مدرب على مجموعة بيانات Tiger-Pose؟

لإجراء الاستنتاج باستخدام نموذج YOLO26 مدرب على مجموعة بيانات Tiger-Pose، يمكنك استخدام مقتطفات الكود التالية. للحصول على دليل مفصل، تفضل بزيارة صفحة التنبؤ:

مثال على الاستدلال
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

ما هي فوائد استخدام مجموعة بيانات Tiger-Pose لتقدير الوضعية؟

توفر مجموعة بيانات Tiger-Pose، على الرغم من حجمها المعتدل البالغ 210 صور للتدريب، مجموعة متنوعة من الصور المثالية لاختبار خطوط أنابيب تقدير الوضعية. تساعد مجموعة البيانات في تحديد الأخطاء المحتملة وتعمل كخطوة أولية قبل العمل مع مجموعات بيانات أكبر. بالإضافة إلى ذلك، تدعم مجموعة البيانات تدريب وتحسين خوارزميات تقدير الوضعية باستخدام أدوات متقدمة مثل منصة Ultralytics وYOLO26، مما يعزز أداء النموذج والدقة.

التعليقات