Набор данных KITTI
Набор данных kitti - один из самых влиятельных эталонных наборов данных для автономного вождения и компьютерного зрения. Выпущенный Технологическим институтом Карлсруэ и Технологическим институтом Toyota в Чикаго, он содержит данные стереокамер, LiDAR и GPS/IMU, собранные в реальных сценариях вождения.
Он широко используется для оценки алгоритмов обнаружения объектов, оценки глубины, оптического потока и визуальной одометрии. Набор данных полностью совместим с Ultralytics YOLO11 для задач обнаружения двумерных объектов и может быть легко интегрирован в платформу Ultralytics для обучения и оценки.
Структура набора данных
Предупреждение
Оригинальный тестовый набор Kitti здесь исключен, так как не содержит достоверных аннотаций.
В общей сложности набор включает 7 481 изображение, каждое из которых сопровождается подробными аннотациями к таким объектам, как автомобили, пешеходы, велосипедисты и другие элементы дороги. Набор данных разделен на два основных подмножества:
- Обучающий набор: Содержит 5 985 изображений с аннотированными метками, используемых для обучения модели.
- Валидационный набор: Включает 1 496 изображений с соответствующими аннотациями, используемых для оценки производительности и бенчмаркинга.
Приложения
Набор данных Kitti позволяет достичь прогресса в автономном вождении и робототехнике, поддерживая такие задачи, как:
- Восприятие автономных транспортных средств: Обучение моделей для обнаружения и отслеживания транспортных средств, пешеходов и препятствий для безопасной навигации в системах автономного вождения.
- Понимание трехмерных сцен: Поддержка оценки глубины, стереозрения и локализации 3D-объектов, помогающая машинам понимать пространственное окружение.
- Оптический поток и предсказание движения: Анализ движения для прогнозирования перемещения объектов и улучшения планирования траектории в динамических средах.
- Бенчмаркинг компьютерного зрения: Служит в качестве стандартного эталона для оценки производительности в различных задачах компьютерного зрения, включая обнаружение объектов и отслеживание.
YAML-файл набора данных
Ultralytics определяет конфигурацию набора данных kitti с помощью файла YAML. В этом файле указываются пути к набору данных, метки классов и метаданные, необходимые для обучения. Файл конфигурации доступен по адресу ultralytics
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
Использование
Чтобы обучить модель YOLO11n на наборе данных kitti в течение 100 эпох при размере изображения 640, выполните следующие команды. Более подробную информацию см. на странице Обучение.
Пример обучения
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
Вы также можете выполнять задачи оценки, вывода и экспорта непосредственно из командной строки или Python API, используя тот же файл конфигурации.
Примеры изображений и аннотации
В наборе данных kitti представлены различные сценарии вождения. Каждое изображение содержит аннотации ограничительных рамок для задач обнаружения двумерных объектов. Примеры демонстрируют богатое разнообразие набора данных, позволяя надежно обобщать модели в различных реальных условиях.

Цитирование и благодарности
Если вы используете набор данных kitti в своих исследованиях, пожалуйста, ссылайтесь на следующую статью:
Цитировать
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
Мы благодарим KITTI Vision Benchmark Suite за предоставление этого обширного набора данных, который продолжает определять прогресс в области компьютерного зрения, робототехники и автономных систем. Посетите веб-сайт kitti для получения дополнительной информации.
Вопросы и ответы
Для чего используется набор данных kitti?
Набор данных kitti в основном используется для исследований компьютерного зрения в области автономного вождения, поддерживая такие задачи, как обнаружение объектов, оценка глубины, оптический поток и 3D-локализация.
Сколько изображений входит в набор данных kitti?
Набор данных включает 5 985 маркированных учебных изображений и 1 496 проверочных изображений, снятых для городских, сельских и шоссейных сцен. Оригинальный тестовый набор исключен из рассмотрения, поскольку он не содержит истинных аннотаций.
Какие классы объектов аннотированы в наборе данных?
kitti включает в себя аннотации для таких объектов, как автомобили, пешеходы, велосипедисты, грузовики, трамваи и другие участники дорожного движения.
Можно ли обучать модели Ultralytics YOLO11 с помощью набора данных kitti?
Да, kitti полностью совместим с Ultralytics YOLO11. Вы можете обучать и проверять модели напрямую, используя предоставленный файл конфигурации YAML.
Где найти файл конфигурации набора данных kitti?
Вы можете получить доступ к файлу YAML по адресу ultralytics.