Link to this sectionНабор данных KITTI#
Набор данных kitti — один из самых влиятельных эталонных наборов данных для автономного вождения и компьютерного зрения. Выпущенный Технологическим институтом Карлсруэ и Чикагским отделением Технологического института Тойоты, он содержит данные стереокамер, LiDAR и GPS/IMU, собранные в реальных дорожных условиях.
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
Он широко используется для оценки алгоритмов обнаружения объектов, оценки глубины, оптического потока и визуальной одометрии. Набор данных полностью совместим с Ultralytics YOLO26 для задач 2D-обнаружения объектов и может быть легко интегрирован в платформу Ultralytics для обучения и оценки.
Link to this sectionСтруктура набора данных#
Оригинальный тестовый набор kitti здесь исключен, поскольку он не содержит аннотаций ground-truth.
В общей сложности набор данных включает 7481 изображение, каждое из которых сопровождается подробными аннотациями для таких объектов, как автомобили, пешеходы, велосипедисты и другие элементы дороги. Набор данных разделен на два основных подмножества:
- Обучающий набор: Содержит 5985 изображений с аннотированными метками, используемыми для обучения моделей.
- Валидационный набор: Включает 1496 изображений с соответствующими аннотациями, используемыми для оценки производительности и бенчмаркинга.
Link to this sectionПрименение#
Набор данных kitti способствует прогрессу в области автономного вождения и робототехники, поддерживая такие задачи, как:
- Восприятие автономного транспортного средства: Обучение моделей обнаружению и отслеживанию транспортных средств, пешеходов и препятствий для безопасной навигации в системах беспилотного вождения.
- Понимание 3D-сцены: Поддержка оценки глубины, стереозрения и 3D-локализации объектов для помощи машинам в понимании пространственного окружения.
- Оптический поток и прогнозирование движения: Анализ движения для предсказания перемещения объектов и улучшения планирования траектории в динамических средах.
- Бенчмаркинг компьютерного зрения: Использование в качестве стандартного эталона для оценки производительности в различных задачах компьютерного зрения, включая обнаружение объектов и отслеживание.
Link to this sectionYAML набора данных#
Ultralytics определяет конфигурацию набора данных kitti с помощью файла YAML. Этот файл задает пути к набору данных, метки классов и метаданные, необходимые для обучения. Файл конфигурации доступен по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipLink to this sectionИспользование#
Чтобы обучить модель YOLO26n на наборе данных kitti в течение 100 эпох с размером изображения 640, используй следующие команды. Более подробную информацию см. на странице Обучение.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)Ты также можешь выполнять задачи оценки, инференса и экспорта прямо из командной строки или Python API, используя тот же файл конфигурации.
Link to this sectionПримеры изображений и аннотации#
Набор данных kitti предоставляет разнообразные сценарии вождения. Каждое изображение включает аннотации BBox для задач 2D-обнаружения объектов. Примеры демонстрируют богатство набора данных, что обеспечивает надежную генерализацию моделей в различных реальных условиях.
Link to this sectionЦитирование и благодарности#
Если ты используешь набор данных kitti в своем исследовании, пожалуйста, сошлися на следующую статью:
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}Мы выражаем благодарность KITTI Vision Benchmark Suite за предоставление этого всеобъемлющего набора данных, который продолжает определять прогресс в компьютерном зрении, робототехнике и автономных системах. Посети веб-сайт kitti для получения дополнительной информации.
Link to this sectionЧасто задаваемые вопросы#
Link to this sectionДля чего используется набор данных kitti?#
Набор данных kitti в основном используется для исследований в области компьютерного зрения в автономном вождении, поддерживая такие задачи, как обнаружение объектов, оценка глубины, оптический поток и 3D-локализация.
Link to this sectionСколько изображений включено в набор данных kitti?#
Набор данных включает 5985 размеченных обучающих изображений и 1496 валидационных изображений, снятых в городских, сельских и пригородных условиях. Оригинальный тестовый набор здесь исключен, так как он не содержит аннотаций ground-truth.
Link to this sectionКакие классы объектов аннотированы в наборе данных?#
kitti включает аннотации для таких объектов, как автомобили, пешеходы, велосипедисты, грузовики, трамваи и другие участники дорожного движения.
Link to this sectionМогу ли я обучать модели Ultralytics YOLO26, используя набор данных kitti?#
Да, kitti полностью совместим с Ultralytics YOLO26. Ты можешь обучать и валидировать модели напрямую, используя предоставленный файл конфигурации YAML.
Link to this sectionГде я могу найти файл конфигурации набора данных kitti?#
Ты можешь получить доступ к файлу YAML по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.