KITTI 数据集
KITTI 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。它由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所发布,包含从真实驾驶场景中收集的立体相机、激光雷达和 GPS/IMU 数据。
观看: 如何在 KITTI 数据集上训练 Ultralytics YOLO11 🚀
它广泛用于评估目标检测、深度估计、光流和视觉里程计中的算法。该数据集与 Ultralytics YOLO11 完全兼容,适用于 2D 目标检测任务,并且可以轻松集成到 Ultralytics 平台进行训练和评估。
数据集结构
警告
Kitti 原始测试集在此处被排除,因为它不包含真实标注。
总计,该数据集包含7,481张图像,每张图像都配有详细的标注,用于汽车、行人、骑行者和其他道路元素等对象。该数据集分为两个主要子集:
- 训练集:包含 5,985 张带有标注标签的图像,用于模型训练。
- 验证集: 包含1,496张带有相应标注的图像,用于性能评估和基准测试。
应用
KITTI 数据集推动了自动驾驶和机器人技术的发展,支持以下任务:
- 自动驾驶车辆感知:训练模型以 detect 和 track 车辆、行人及障碍物,以实现自动驾驶系统中的安全导航。
- 3D 场景理解:支持深度估计、立体视觉和 3D 对象定位,以帮助机器理解空间环境。
- 光流和运动预测:实现运动分析,以预测物体的运动并改善动态环境中的轨迹规划。
- 计算机视觉基准测试:作为评估多种视觉任务(包括目标检测和 track)性能的标准基准。
数据集 YAML
Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类别标签和元数据。配置文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取。
Ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
用法
要在 kitti 数据集上训练 YOLO11n 模型,进行 100 个 epoch,图像尺寸为 640,请使用以下命令。有关更多详细信息,请参阅训练页面。
训练示例
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
您还可以使用相同的配置文件,直接从命令行或Python API 执行评估、推理和导出任务。
Sample Images 和注释
kitti数据集提供了多样化的驾驶场景。每张图像都包含用于2D目标检测任务的边界框标注。这些示例展示了数据集的丰富多样性,使模型能够在各种真实世界条件下实现鲁棒的泛化。

引用和致谢
如果您在研究中使用kitti数据集,请引用以下论文:
引用
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
我们感谢 KITTI 视觉基准套件提供了这个全面的数据集,该数据集持续推动着计算机视觉、机器人技术和自主系统领域的发展。访问kitti 网站了解更多信息。
常见问题
kitti数据集用于什么?
kitti数据集主要用于自动驾驶领域的计算机视觉研究,支持目标检测、深度估计、光流和3D定位等任务。
KITTI数据集中包含多少图像?
该数据集包含5,985张带标签的训练图像和1,496张验证图像,这些图像捕获自城市、乡村和高速公路场景。原始测试集在此处被排除,因为它不包含真实标注。
数据集中标注了哪些对象类别?
Kitti 包含对诸如汽车、行人、骑行者、卡车、有轨电车以及其他道路使用者等对象的标注。
我可以使用 kitti 数据集训练 Ultralytics YOLO11 模型吗?
是的,kitti 完全兼容 Ultralytics YOLO11。您可以直接使用提供的 YAML 配置文件训练和验证模型。
在哪里可以找到 kitti 数据集配置文件?
您可以访问yaml 上的 YAML 文件。