انتقل إلى المحتوى

مجموعة بيانات وضع النمر

مقدمة

Ultralytics يقدم مجموعة بيانات Tiger-Pose ، وهي مجموعة متعددة الاستخدامات مصممة لمهام تقدير الوضع. تتألف مجموعة البيانات هذه من 263 صورة مصدرها فيديو YouTube ، مع تخصيص 210 صورة للتدريب و 53 للتحقق من صحتها. إنه بمثابة مورد ممتاز لاختبار خوارزمية تقدير الوضع واستكشاف الأخطاء وإصلاحها.

على الرغم من حجمها الذي يمكن التحكم فيه وهو 210 صورة ، فإن مجموعة بيانات tiger-pose توفر التنوع ، مما يجعلها مناسبة لتقييم خطوط أنابيب التدريب ، وتحديد الأخطاء المحتملة ، والعمل كخطوة أولية قيمة قبل العمل مع مجموعات بيانات أكبر لتقدير الوضع.

مجموعة البيانات هذه مخصصة للاستخدام مع Ultralytics المحور و YOLOv8.



شاهد: قطار YOLOv8 نموذج Pose على مجموعة بيانات Tiger-Pose باستخدام Ultralytics محور

مجموعة البيانات YAML

يعمل ملف YAML (لغة ترميز أخرى) كوسيلة لتحديد تفاصيل التكوين لمجموعة البيانات. وهو يشمل البيانات الهامة مثل مسارات الملفات وتعريفات الفئات والمعلومات الأخرى ذات الصلة. على وجه التحديد ، بالنسبة ل tiger-pose.yaml ملف ، يمكنك التحقق Ultralytics ملف تكوين مجموعة بيانات Tiger-Pose.

ultralytics/cfg/datasets/tiger-pose.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# Tiger Pose dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/pose/tiger-pose/
# Example usage: yolo train data=tiger-pose.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── tiger-pose  ← downloads here (75.3 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/tiger-pose # dataset root dir
train: train # train images (relative to 'path') 210 images
val: val # val images (relative to 'path') 53 images

# Keypoints
kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

# Classes
names:
  0: tiger

# Download script/URL (optional)
download: https://ultralytics.com/assets/tiger-pose.zip

استخدام

لتدريب أ YOLOv8n-pose model على مجموعة بيانات Tiger-Pose ل 100 حقبة بحجم صورة 640 ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-pose.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='tiger-pose.yaml', epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo task=pose mode=train data=tiger-pose.yaml model=yolov8n.pt epochs=100 imgsz=640

عينة من الصور والتعليقات التوضيحية

فيما يلي بعض الأمثلة على الصور من مجموعة بيانات Tiger-Pose ، جنبا إلى جنب مع التعليقات التوضيحية المقابلة لها:

صورة عينة مجموعة البيانات

  • صورة فسيفسائية: توضح هذه الصورة دفعة تدريب مكونة من صور مجموعة بيانات فسيفسائية. الفسيفساء هي تقنية تستخدم أثناء التدريب تجمع بين صور متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام الكائنات المختلفة ونسب العرض إلى الارتفاع والسياقات.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات Tiger-Pose وفوائد استخدام الفسيفساء أثناء عملية التدريب.

مثال على الاستدلال

مثال على الاستدلال

from ultralytics import YOLO

# Load a model
model = YOLO('path/to/best.pt')  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True)
# Run inference using a tiger-pose trained model
yolo task=pose mode=predict source="https://www.youtube.com/watch?v=MIBAT6BGE6U&pp=ygUYdGlnZXIgd2Fsa2luZyByZWZlcmVuY2Ug" show=True model="path/to/best.pt"

الاستشهادات والشكر

تم إصدار مجموعة البيانات المتاحة تحت AGPL-3.0 الترخيص.



تم النشر في 2023-11-12, اخر تحديث 2024-02-03
المؤلفون: جلين جوشر (5) ، رضوان منور (1)

التعليقات