KITTI 数据集
kitti 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。该数据集由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所发布,包含从真实驾驶场景中收集的立体摄像头、激光雷达和 GPS/IMU 数据。
该数据集广泛用于评估物体检测、深度估计、光流和视觉里程测量中的算法。该数据集与用于二维物体检测任务的Ultralytics YOLO11 完全兼容,可轻松集成到Ultralytics 平台中进行训练和评估。
数据集结构
警告
这里不包括 Kitti 原始测试集,因为它不包含地面实况注释。
该数据集共包含 7,481 张图片,每张图片都配有详细的注释,包括汽车、行人、骑自行车者和其他道路元素。数据集主要分为两个子集:
- 训练集:包含 5,985 张带注释标签的图像,用于模型训练。
- 验证集:包括 1,496 幅图像和相应的注释,用于性能评估和基准测试。
应用
Kitti 数据集推动了自动驾驶和机器人技术的进步,为以下任务提供了支持:
- 自动驾驶车辆感知:训练模型以探测和跟踪车辆、行人和障碍物,实现自动驾驶系统的安全导航。
- 三维场景理解:支持深度估计、立体视觉和三维物体定位,帮助机器理解空间环境。
- 光流与运动预测:通过运动分析预测物体运动,改进动态环境中的轨迹规划。
- 计算机视觉基准:作为评估多项视觉任务(包括物体检测和跟踪)性能的标准基准。
数据集 YAML
Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类标签和元数据。配置文件可从ultralytics 获取。
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
用法
要在 kitti 数据集上训练 YOLO11n 模型 100 个历元(图像大小为 640),请使用以下命令。有关详细信息,请参阅训练页面。
训练示例
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
您还可以使用相同的配置文件,直接从命令行或Python API 执行评估、推理和导出任务。
Sample Images 和注释
kitti 数据集提供了多种驾驶场景。每张图像都包含用于二维物体检测任务的边界框注释。该示例展示了数据集的丰富多样性,使模型能够在不同的真实世界条件下进行稳健的泛化。

引用和致谢
如果您在研究中使用 kitti 数据集,请引用以下论文:
报价
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
我们感谢 KITTI 视觉基准套件提供这一全面的数据集,该数据集将继续推动计算机视觉、机器人和自主系统领域的进步。更多信息,请访问kitti 网站。
常见问题
kitti 数据集的用途是什么?
kitti 数据集主要用于自动驾驶领域的计算机视觉研究,支持物体检测、深度估计、光流和三维定位等任务。
kitti 数据集中包含多少张图片?
该数据集包括 5,985 张标注训练图像和 1,496 张验证图像,拍摄场景涵盖城市、乡村和高速公路。由于原始测试集不包含地面实况注释,因此不包括在此。
数据集中标注了哪些对象类别?
kitti 包括对汽车、行人、骑自行车的人、卡车、有轨电车和其他道路使用者等对象的注释。
我可以使用 kitti 数据集训练Ultralytics YOLO11 模型吗?
是的,kitti 与Ultralytics YOLO11 完全兼容。您可以使用提供的 YAML 配置文件直接训练和验证模型。
在哪里可以找到 kitti 数据集配置文件?
您可以访问ultralytics 上的 YAML 文件。