تخطي إلى المحتوى

مجموعة بيانات KITTI

تعد مجموعة بيانات kitti واحدة من أكثر مجموعات البيانات المعيارية تأثيراً في مجال القيادة الذاتية والرؤية الحاسوبية. وقد تم إصدارها من قبل معهد كارلسروه للتكنولوجيا ومعهد تويوتا التكنولوجي في شيكاغو، وهي تحتوي على بيانات كاميرا ستيريو، و LiDAR، ونظام تحديد المواقع العالمي/وحدة التحكم عن بُعد، والتي تم جمعها من سيناريوهات القيادة في العالم الحقيقي.

وهي تُستخدم على نطاق واسع لتقييم الخوارزميات في اكتشاف الأجسام وتقدير العمق والتدفق البصري وقياس المسافات البصرية. مجموعة البيانات متوافقة تمامًا مع Ultralytics YOLO11 لمهام اكتشاف الأجسام ثنائية الأبعاد ويمكن دمجها بسهولة في منصة Ultralytics للتدريب والتقييم.

هيكل مجموعة البيانات

تحذير

تم استبعاد مجموعة الاختبار الأصلية من Kitti هنا لأنها لا تحتوي على شروح حقيقية أرضية.

تتضمن مجموعة البيانات إجمالاً 7,481 صورة، كل منها مقترنة بتعليقات توضيحية مفصلة لأشياء مثل السيارات والمشاة وراكبي الدراجات وعناصر الطريق الأخرى. تنقسم مجموعة البيانات إلى مجموعتين فرعيتين رئيسيتين:

  • مجموعة التدريب: تحتوي على 5,985 صورة مع تسميات مشروحة تُستخدم لتدريب النموذج.
  • مجموعة التحقق من الصحة: تتضمن 1,496 صورة مع التعليقات التوضيحية المقابلة المستخدمة لتقييم الأداء والمقارنة المرجعية.

التطبيقات

تمكّن مجموعة بيانات Kitti من تحقيق تقدم في مجال القيادة الذاتية والروبوتات، وتدعم مهام مثل:

  • إدراك المركبات ذاتية القيادة: نماذج التدريب لاكتشاف وتتبع المركبات والمشاة والعوائق من أجل الملاحة الآمنة في أنظمة القيادة الذاتية.
  • فهم المشهد ثلاثي الأبعاد: دعم تقدير العمق والرؤية المجسمة وتوطين الأجسام ثلاثية الأبعاد لمساعدة الآلات على فهم البيئات المكانية.
  • التدفق البصري والتنبؤ بالحركة: تمكين تحليل الحركة للتنبؤ بحركة الأجسام وتحسين تخطيط المسار في البيئات الديناميكية.
  • قياس الرؤية الحاسوبية: بمثابة معيار قياسي لتقييم الأداء عبر مهام رؤية متعددة، بما في ذلك اكتشاف الأجسام وتتبعها.

ملف YAML لمجموعة البيانات

تحدد Ultralytics تكوين مجموعة بيانات kitti باستخدام ملف YAML. يحدد هذا الملف مسارات مجموعة البيانات وتسميات الفئات والبيانات الوصفية المطلوبة للتدريب. ملف التكوين متاح على ultralytics

ultralytics.يامل

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

الاستخدام

لتدريب نموذج YOLO11n على مجموعة بيانات kitti ل 100 حلقة تدريبية بحجم صورة 640، استخدم الأوامر التالية. لمزيد من التفاصيل، راجع صفحة التدريب.

مثال على التدريب

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

يمكنك أيضًا إجراء مهام التقييم والاستدلال والتصدير مباشرةً من سطر الأوامر أو واجهة برمجة تطبيقات Python باستخدام ملف التكوين نفسه.

عينات من الصور والشروحات التوضيحية

توفر مجموعة بيانات kitti سيناريوهات قيادة متنوعة. تتضمن كل صورة توضيحات المربع المحدد لمهام اكتشاف الأجسام ثنائية الأبعاد. يعرض المثال مجموعة البيانات المتنوعة الثرية، مما يتيح تعميماً قوياً للنموذج عبر ظروف العالم الحقيقي المتنوعة.

صورة عينة كيتي

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات كيتي في بحثك، يُرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

نشكر مجموعة معايير الرؤية KITTI Vision Benchmark Suite على توفير مجموعة البيانات الشاملة هذه التي تواصل تشكيل التقدم في مجال الرؤية الحاسوبية والروبوتات والأنظمة المستقلة. قم بزيارة موقع kitti الإلكتروني لمزيد من المعلومات.

الأسئلة الشائعة

ما هي مجموعة بيانات كيتي المستخدمة؟

تُستخدم مجموعة بيانات kitti في المقام الأول في أبحاث الرؤية الحاسوبية في القيادة الذاتية، وتدعم مهام مثل اكتشاف الأجسام وتقدير العمق والتدفق البصري وتحديد الموقع ثلاثي الأبعاد.

كم عدد الصور المضمنة في مجموعة بيانات كيتي؟

تتضمن مجموعة البيانات 5,985 صورة تدريبية موسومة و1,496 صورة للتحقق من صحة الصور الملتقطة في مشاهد حضرية وريفية وسريعة. مجموعة الاختبار الأصلية مستبعدة هنا لأنها لا تحتوي على شروح حقيقية على الأرض.

ما هي فئات الكائنات المشروحة في مجموعة البيانات؟

تتضمن kitti تعليقات توضيحية لأجسام مثل السيارات والمشاة وراكبي الدراجات والشاحنات والترام ومستخدمي الطرق المتنوعة.

هل يمكنني تدريب نماذج Ultralytics YOLO11 باستخدام مجموعة بيانات kitti؟

نعم، kitti متوافق تمامًا مع Ultralytics YOLO11. يمكنك تدريب النماذج والتحقق من صحتها مباشرةً باستخدام ملف تكوين YAML المتوفر.

أين يمكنني العثور على ملف تكوين مجموعة بيانات kitti؟

يمكنك الوصول إلى ملف YAML على ultralytics



📅 تم إنشاؤه منذ 0 أيام ✏️ تم التحديث منذ 0 أيام

تعليقات