Перейти к содержанию

Набор данных KITTI

Открыть набор данных KITTI в Colab

Набор данных kitti является одним из самых влиятельных эталонных наборов данных для автономного вождения и компьютерного зрения. Выпущенный Технологическим институтом Карлсруэ и Чикагским технологическим институтом Toyota, он содержит данные со стереокамеры, LiDAR и GPS/IMU, собранные в реальных сценариях вождения.



Смотреть: Как обучить Ultralytics YOLO11 на наборе данных KITTI 🚀

Он широко используется для оценки алгоритмов в задачах обнаружения объектов, оценки глубины, оптического потока и визуальной одометрии. Набор данных полностью совместим с Ultralytics YOLO11 для задач 2D-обнаружения объектов и может быть легко интегрирован в платформу Ultralytics для обучения и оценки.

Структура набора данных

Предупреждение

Оригинальный тестовый набор Kitti исключен, поскольку он не содержит ground-truth аннотаций.

Всего набор данных включает 7 481 изображение, каждое из которых снабжено подробными аннотациями для таких объектов, как автомобили, пешеходы, велосипедисты и другие элементы дорожной инфраструктуры. Набор данных разделен на два основных подмножества:

  • Обучающий набор: Содержит 5 985 изображений с аннотированными метками, используемых для обучения модели.
  • Набор для валидации: Включает 1496 изображений с соответствующими аннотациями, используемых для оценки производительности и сравнительного анализа.

Приложения

Набор данных Kitti способствует развитию автономного вождения и робототехники, поддерживая такие задачи, как:

  • Восприятие автономного транспортного средства: Обучение моделей для detect и track транспортные средства, пешеходов и препятствия для безопасной навигации в системах автономного вождения.
  • Понимание 3D-сцен: Поддержка оценки глубины, стереозрения и 3D-локализации объектов, чтобы помочь машинам понимать пространственное окружение.
  • Оптический поток и прогнозирование движения: Обеспечение анализа движения для прогнозирования движения объектов и улучшения планирования траектории в динамических средах.
  • Бенчмаркинг компьютерного зрения: Служит стандартным бенчмарком для оценки производительности в различных задачах компьютерного зрения, включая обнаружение объектов и отслеживание.

YAML-файл набора данных

Ultralytics определяет конфигурацию набора данных kitti с помощью YAML-файла. Этот файл определяет пути к набору данных, метки классов и метаданные, необходимые для обучения. Файл конфигурации доступен по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Использование

Чтобы обучить модель YOLO11n на наборе данных kitti в течение 100 эпох с размером изображения 640, используйте следующие команды. Для получения более подробной информации обратитесь к странице Обучение.

Пример обучения

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

Вы также можете выполнять задачи оценки, inference и export непосредственно из командной строки или Python API, используя тот же файл конфигурации.

Примеры изображений и аннотации

Набор данных kitti предоставляет разнообразные сценарии вождения. Каждое изображение включает аннотации ограничивающей рамки для задач 2D object detection. Пример демонстрирует богатое разнообразие набора данных, обеспечивающее надежное обобщение модели в различных реальных условиях.

Образец изображения Kitti

Цитирование и благодарности

Если вы используете набор данных kitti в своих исследованиях, пожалуйста, сошлитесь на следующую статью:

Цитата

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Мы выражаем признательность KITTI Vision Benchmark Suite за предоставление этого всеобъемлющего набора данных, который продолжает формировать прогресс в области компьютерного зрения, робототехники и автономных систем. Посетите веб-сайт kitti для получения дополнительной информации.

Часто задаваемые вопросы

Для чего используется набор данных kitti?

Набор данных kitti в основном используется для исследований в области компьютерного зрения в автономном вождении, поддерживая такие задачи, как object detection, оценка глубины, оптический поток и 3D-локализация.

Сколько изображений включено в набор данных kitti?

Набор данных включает 5 985 размеченных обучающих изображений и 1 496 изображений для валидации, снятых в городских, сельских и автомагистральных сценах. Исходный тестовый набор исключен, поскольку он не содержит аннотации ground-truth.

Какие классы объектов аннотированы в наборе данных?

kitti включает аннотации для таких объектов, как автомобили, пешеходы, велосипедисты, грузовики, трамваи и другие участники дорожного движения.

Могу ли я обучать модели Ultralytics YOLO11, используя набор данных kitti?

Да, kitti полностью совместим с Ultralytics YOLO11. Вы можете обучать и проверять модели непосредственно с помощью предоставленного файла конфигурации YAML.

Где я могу найти файл конфигурации набора данных kitti?

Вы можете получить доступ к файлу YAML по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.



📅 Создано 1 месяц назад ✏️ Обновлено 1 месяц назад
RizwanMunawar

Комментарии