مجموعة بيانات KITTI

تعد مجموعة بيانات kitti واحدة من أكثر مجموعات بيانات القياس تأثيرًا للقيادة الذاتية ورؤية الكمبيوتر. تم إصداره من قبل معهد كارلسروه للتكنولوجيا ومعهد تويوتا التكنولوجي في شيكاغو، ويحتوي على كاميرا مجسمة و LiDAR وبيانات GPS/IMU التي تم جمعها من سيناريوهات القيادة الواقعية.

شاهد: كيفية تدريب Ultralytics YOLO26 على مجموعة بيانات KITTI 🚀

تُستخدم هذه المجموعة على نطاق واسع لتقييم الخوارزميات في اكتشاف الكائنات، وتقدير العمق، والتدفق البصري، والقياس البصري للمسافة. تتوافق مجموعة البيانات بشكل كامل مع Ultralytics YOLO26 لمهام اكتشاف الكائنات ثنائية الأبعاد، ويمكن دمجها بسهولة في منصة Ultralytics للتدريب والتقييم.

هيكل مجموعة البيانات

تحذير

تم استبعاد مجموعة اختبار Kitti الأصلية هنا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأساسية.

إجمالاً، تتضمن مجموعة البيانات 7,481 صورة، كل منها مقترنة بتعليقات توضيحية مفصلة للكائنات مثل السيارات والمشاة وراكبي الدراجات وعناصر الطريق الأخرى. تنقسم مجموعة البيانات إلى مجموعتين فرعيتين رئيسيتين:

مجموعة التدريب: تحتوي على 5,985 صورة مع تسميات توضيحية مُستخدمة لتدريب النموذج.
Validation set: تتضمن 1,496 صورة مع الشروح التوضيحية المقابلة المستخدمة لتقييم الأداء ووضع المعايير.

التطبيقات

تمكّن مجموعة بيانات Kitti من تحقيق تطورات في القيادة الذاتية والروبوتات، وتدعم مهامًا مثل:

إدراك المركبات ذاتية القيادة: تدريب النماذج على اكتشاف وتتبع المركبات والمشاة والعقبات من أجل التنقل الآمن في الأنظمة ذاتية القيادة.
فهم المشهد ثلاثي الأبعاد: دعم تقدير العمق، والرؤية المجسمة، وتحديد موقع الكائنات ثلاثية الأبعاد لمساعدة الآلات على فهم البيئات المكانية.
التدفق البصري والتنبؤ بالحركة: تمكين تحليل الحركة للتنبؤ بحركة الكائنات وتحسين تخطيط المسار في البيئات الديناميكية.
قياس أداء رؤية الكمبيوتر: بمثابة معيار قياسي لتقييم الأداء عبر مهام رؤية متعددة، بما في ذلك الكشف عن الكائنات وتتبعها.

ملف YAML لمجموعة البيانات

يحدد Ultralytics تكوين مجموعة بيانات kitti باستخدام ملف YAML. يحدد هذا الملف مسارات مجموعة البيانات وتصنيفات الفئات والبيانات الوصفية المطلوبة للتدريب. يتوفر ملف التكوين على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

Ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

الاستخدام

لتدريب نموذج YOLO26n على مجموعة بيانات kitti لمدة 100 حقبة تدريبية بحجم صورة 640، استخدم الأوامر التالية. لمزيد من التفاصيل، ارجع إلى صفحة التدريب.

مثال على التدريب

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

yolo detect train data=kitti.yaml model=yolo26n.pt epochs=100 imgsz=640

يمكنك أيضًا إجراء مهام التقييم و الاستدلال و التصدير مباشرةً من سطر الأوامر أو واجهة برمجة تطبيقات python باستخدام نفس ملف التكوين.

عينات من الصور والشروحات التوضيحية

توفر مجموعة بيانات kitti سيناريوهات قيادة متنوعة. تتضمن كل صورة تعليقات توضيحية على المربعات المحيطة لمهام الكشف عن الأجسام ثنائية الأبعاد. تظهر الأمثلة التنوع الغني لمجموعة البيانات، مما يتيح تعميم النموذج بشكل قوي عبر ظروف متنوعة في العالم الواقعي.

عينة من مجموعة بيانات KITTI الخاصة باكتشاف المركبات

الاقتباسات والإقرارات

إذا كنت تستخدم مجموعة بيانات kitti في بحثك، فيرجى الاستشهاد بالورقة التالية:

اقتباس

BibTeX

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

نتقدم بالشكر إلى مجموعة بيانات KITTI Vision Benchmark Suite لتقديمها هذه المجموعة الشاملة من البيانات التي لا تزال تشكل التقدم في مجال رؤية الكمبيوتر والروبوتات والأنظمة المستقلة. تفضل بزيارة موقع kitti للمزيد من المعلومات.

أسئلة متكررة

فيما تستخدم مجموعة بيانات kitti؟

تستخدم مجموعة بيانات kitti في المقام الأول لأبحاث رؤية الكمبيوتر في القيادة الذاتية، ودعم مهام مثل object detection وتقدير العمق والتدفق البصري وتحديد الموقع ثلاثي الأبعاد.

كم عدد الصور الموجودة في مجموعة بيانات kitti؟

تتضمن مجموعة البيانات 5,985 صورة تدريب مُعلّمة و 1,496 صورة للتحقق تم التقاطها عبر مشاهد حضرية وريفية وعلى الطرق السريعة. تم استبعاد مجموعة الاختبار الأصلية هنا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأساسية.

ما هي فئات الكائنات التي تم التعليق عليها في مجموعة البيانات؟

تتضمن Kitti تعليقات توضيحية لكائنات مثل السيارات والمشاة وراكبي الدراجات والشاحنات والترام ومستخدمي الطرق المتنوعين.

هل يمكنني تدريب نماذج Ultralytics YOLO26 باستخدام مجموعة بيانات kitti؟

نعم، تتوافق kitti بشكل كامل مع Ultralytics YOLO26. يمكنك تدريب والتحقق من صحة النماذج مباشرة باستخدام ملف تكوين YAML المتوفر.

أين يمكنني العثور على ملف تكوين مجموعة بيانات kitti؟

يمكنك الوصول إلى ملف YAML في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

📅 تم الإنشاء قبل 3 أشهر ✏️ تم التحديث قبل 17 أيام