مجموعة بيانات KITTI

Open KITTI Dataset In Colab

تعد مجموعة بيانات kitti واحدة من أكثر مجموعات البيانات المرجعية تأثيرًا في مجال القيادة الذاتية ورؤية الحاسوب. تم إصدارها من قبل معهد كارلسروه للتكنولوجيا ومعهد تويوتا التكنولوجي في شيكاغو، وتحتوي على بيانات كاميرا ستيريو، وLiDAR، وبيانات GPS/IMU تم جمعها من سيناريوهات قيادة حقيقية.



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

تُستخدم المجموعة على نطاق واسع لتقييم الخوارزميات في اكتشاف الكائنات، وتقدير العمق، والتدفق البصري، وقياس المسافة البصري. تتوافق مجموعة البيانات تمامًا مع Ultralytics YOLO26 لمهام اكتشاف الكائنات ثنائية الأبعاد، ويمكن دمجها بسهولة في منصة Ultralytics للتدريب والتقييم.

هيكل مجموعة البيانات

تحذير

تم استبعاد مجموعة الاختبار الأصلية لـ kitti من هنا نظرًا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأرضية (ground-truth).

في المجموع، تتضمن مجموعة البيانات 7,481 صورة، كل منها مقترنة بتعليقات توضيحية مفصلة لكائنات مثل السيارات، والمشاة، وراكبي الدراجات، وعناصر الطريق الأخرى. تنقسم مجموعة البيانات إلى مجموعتين فرعيتين رئيسيتين:

  • مجموعة التدريب: تحتوي على 5,985 صورة مع تسميات توضيحية تُستخدم لتدريب النموذج.
  • مجموعة التحقق: تتضمن 1,496 صورة مع التعليقات التوضيحية المقابلة لها المستخدمة لتقييم الأداء والمقارنة المعيارية.

التطبيقات

تمكّن مجموعة بيانات kitti من تحقيق تقدم في القيادة الذاتية والروبوتات، وتدعم مهام مثل:

  • إدراك المركبات ذاتية القيادة: تدريب النماذج لاكتشاف وتتبع المركبات والمشاة والعوائق من أجل ملاحة آمنة في أنظمة القيادة الذاتية.
  • فهم المشهد ثلاثي الأبعاد: دعم تقدير العمق، والرؤية المجسمة (stereo vision)، وتحديد موقع الكائنات ثلاثية الأبعاد لمساعدة الآلات على فهم البيئات المكانية.
  • التدفق البصري والتنبؤ بالحركة: تمكين تحليل الحركة للتنبؤ بحركة الكائنات وتحسين تخطيط المسار في البيئات الديناميكية.
  • قياس أداء رؤية الحاسوب: العمل كمعيار قياسي لتقييم الأداء عبر مهام رؤية متعددة، بما في ذلك اكتشاف الكائنات وتتبعها.

ملف YAML الخاص بمجموعة البيانات

تحدد Ultralytics تكوين مجموعة بيانات kitti باستخدام ملف YAML. يحدد هذا الملف مسارات مجموعة البيانات، وتسميات الفئات، والبيانات الوصفية المطلوبة للتدريب. ملف التكوين متاح على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

الاستخدام

لتدريب نموذج YOLO26n على مجموعة بيانات kitti لمدة 100 دورة تدريبية (epochs) بحجم صورة 640، استخدم الأوامر التالية. لمزيد من التفاصيل، ارجع إلى صفحة التدريب.

مثال على التدريب
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

يمكنك أيضًا تنفيذ مهام التقييم، والاستدلال، والتصدير مباشرة من سطر الأوامر أو Python API باستخدام ملف التكوين نفسه.

صور وعينات تعليقات توضيحية

توفر مجموعة بيانات kitti سيناريوهات قيادة متنوعة. تتضمن كل صورة تعليقات توضيحية لصناديق الإحاطة (bounding box) لمهام اكتشاف الكائنات ثنائية الأبعاد. تعرض الأمثلة التنوع الغني لمجموعة البيانات، مما يتيح تعميمًا قويًا للنموذج عبر ظروف العالم الحقيقي المتنوعة.

KITTI dataset vehicle detection sample

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات kitti في بحثك، فيرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

نحن نقر بفضل KITTI Vision Benchmark Suite لتوفير مجموعة البيانات الشاملة هذه التي تستمر في تشكيل التقدم في رؤية الحاسوب، والروبوتات، والأنظمة الذاتية. تفضل بزيارة موقع kitti لمزيد من المعلومات.

الأسئلة الشائعة

فيمَ تُستخدم مجموعة بيانات kitti؟

تُستخدم مجموعة بيانات kitti في المقام الأول لأبحاث رؤية الحاسوب في مجال القيادة الذاتية، وتدعم مهام مثل اكتشاف الكائنات، وتقدير العمق، والتدفق البصري، والتحديد المكاني ثلاثي الأبعاد.

كم عدد الصور المدرجة في مجموعة بيانات kitti؟

تتضمن مجموعة البيانات 5,985 صورة تدريب مصنفة و1,496 صورة تحقق تم التقاطها عبر مشاهد حضرية وريفية وسريعة. تم استبعاد مجموعة الاختبار الأصلية هنا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأرضية.

ما هي فئات الكائنات التي تم توضيحها في مجموعة البيانات؟

تتضمن kitti تعليقات توضيحية لكائنات مثل السيارات، والمشاة، وراكبي الدراجات، والشاحنات، والترام، ومستخدمي الطريق المتنوعين.

هل يمكنني تدريب نماذج Ultralytics YOLO26 باستخدام مجموعة بيانات kitti؟

نعم، تتوافق kitti تمامًا مع Ultralytics YOLO26. يمكنك التدريب والتحقق من النماذج مباشرة باستخدام ملف تكوين YAML المقدم.

أين يمكنني العثور على ملف تكوين مجموعة بيانات kitti؟

يمكنك الوصول إلى ملف YAML على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

التعليقات