مجموعة بيانات KITTI
تعد مجموعة بيانات kitti واحدة من أكثر مجموعات بيانات القياس تأثيرًا للقيادة الذاتية ورؤية الكمبيوتر. تم إصداره من قبل معهد كارلسروه للتكنولوجيا ومعهد تويوتا التكنولوجي في شيكاغو، ويحتوي على كاميرا مجسمة و LiDAR وبيانات GPS/IMU التي تم جمعها من سيناريوهات القيادة الواقعية.
شاهد: كيفية تدريب Ultralytics YOLO11 على مجموعة بيانات KITTI 🚀
يستخدم على نطاق واسع لتقييم الخوارزميات في مجال الـ detect للكائنات، وتقدير العمق، والتدفق البصري، وقياس المسافات البصرية. تتوافق مجموعة البيانات تمامًا مع Ultralytics YOLO11 لمهام الـ detect ثنائية الأبعاد ويمكن دمجها بسهولة في منصة Ultralytics للتدريب والتقييم.
هيكل مجموعة البيانات
تحذير
تم استبعاد مجموعة اختبار Kitti الأصلية هنا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأساسية.
إجمالاً، تتضمن مجموعة البيانات 7,481 صورة، كل منها مقترنة بتعليقات توضيحية مفصلة للكائنات مثل السيارات والمشاة وراكبي الدراجات وعناصر الطريق الأخرى. تنقسم مجموعة البيانات إلى مجموعتين فرعيتين رئيسيتين:
- مجموعة التدريب: تحتوي على 5,985 صورة مع تسميات توضيحية مُستخدمة لتدريب النموذج.
- Validation set: تتضمن 1,496 صورة مع الشروح التوضيحية المقابلة المستخدمة لتقييم الأداء ووضع المعايير.
التطبيقات
تمكّن مجموعة بيانات Kitti من تحقيق تطورات في القيادة الذاتية والروبوتات، وتدعم مهامًا مثل:
- إدراك المركبات ذاتية القيادة: تدريب النماذج على اكتشاف وتتبع المركبات والمشاة والعقبات من أجل التنقل الآمن في الأنظمة ذاتية القيادة.
- فهم المشهد ثلاثي الأبعاد: دعم تقدير العمق، والرؤية المجسمة، وتحديد موقع الكائنات ثلاثية الأبعاد لمساعدة الآلات على فهم البيئات المكانية.
- التدفق البصري والتنبؤ بالحركة: تمكين تحليل الحركة للتنبؤ بحركة الكائنات وتحسين تخطيط المسار في البيئات الديناميكية.
- قياس أداء رؤية الكمبيوتر: بمثابة معيار قياسي لتقييم الأداء عبر مهام رؤية متعددة، بما في ذلك الكشف عن الكائنات وتتبعها.
ملف YAML لمجموعة البيانات
يحدد Ultralytics تكوين مجموعة بيانات kitti باستخدام ملف YAML. يحدد هذا الملف مسارات مجموعة البيانات وتصنيفات الفئات والبيانات الوصفية المطلوبة للتدريب. يتوفر ملف التكوين على https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.
Ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
الاستخدام
لتدريب نموذج YOLO11n على مجموعة بيانات kitti لعدد 100 حقبة (epoch) بحجم صورة 640، استخدم الأوامر التالية. لمزيد من التفاصيل، ارجع إلى صفحة التدريب.
مثال على التدريب
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
يمكنك أيضًا إجراء مهام التقييم و الاستدلال و التصدير مباشرةً من سطر الأوامر أو واجهة برمجة تطبيقات python باستخدام نفس ملف التكوين.
عينات من الصور والشروحات التوضيحية
توفر مجموعة بيانات kitti سيناريوهات قيادة متنوعة. تتضمن كل صورة تعليقات توضيحية للمربع المحيط لمهام object detection ثنائية الأبعاد. يعرض المثال التنوع الغني لمجموعة البيانات، مما يتيح تعميم النموذج القوي عبر الظروف الواقعية المتنوعة.

الاقتباسات والإقرارات
إذا كنت تستخدم مجموعة بيانات kitti في بحثك، فيرجى الاستشهاد بالورقة التالية:
اقتباس
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
نتقدم بالشكر إلى مجموعة بيانات KITTI Vision Benchmark Suite لتقديمها هذه المجموعة الشاملة من البيانات التي لا تزال تشكل التقدم في مجال رؤية الكمبيوتر والروبوتات والأنظمة المستقلة. تفضل بزيارة موقع kitti للمزيد من المعلومات.
أسئلة متكررة
فيما تستخدم مجموعة بيانات kitti؟
تستخدم مجموعة بيانات kitti في المقام الأول لأبحاث رؤية الكمبيوتر في القيادة الذاتية، ودعم مهام مثل object detection وتقدير العمق والتدفق البصري وتحديد الموقع ثلاثي الأبعاد.
كم عدد الصور الموجودة في مجموعة بيانات kitti؟
تتضمن مجموعة البيانات 5,985 صورة تدريب مُعلّمة و 1,496 صورة للتحقق تم التقاطها عبر مشاهد حضرية وريفية وعلى الطرق السريعة. تم استبعاد مجموعة الاختبار الأصلية هنا لأنها لا تحتوي على تعليقات توضيحية للحقيقة الأساسية.
ما هي فئات الكائنات التي تم التعليق عليها في مجموعة البيانات؟
تتضمن Kitti تعليقات توضيحية لكائنات مثل السيارات والمشاة وراكبي الدراجات والشاحنات والترام ومستخدمي الطرق المتنوعين.
هل يمكنني تدريب نماذج Ultralytics YOLO11 باستخدام مجموعة بيانات kitti؟
نعم، kitti متوافق تمامًا مع Ultralytics YOLO11. يمكنك تدريب و التحقق من صحة النماذج مباشرةً باستخدام ملف تكوين YAML المتوفر.
أين يمكنني العثور على ملف تكوين مجموعة بيانات kitti؟
يمكنك الوصول إلى ملف YAML في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.