KITTI 数据集

Open KITTI Dataset In Colab

kitti 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。它由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合发布,包含从真实驾驶场景中采集的立体相机、LiDAR 和 GPS/IMU 数据。



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

它被广泛用于评估目标检测、深度估计、光流和视觉里程计等算法。该数据集与 Ultralytics YOLO26 完全兼容,可用于 2D 目标检测任务,并能轻松集成到 Ultralytics 平台中进行训练和评估。

数据集结构

警告

由于 kitti 的原始测试集不包含真实标注(ground-truth annotations),因此此处将其排除在外。

该数据集共包含 7,481 张图像,每张图像都配有针对汽车、行人、骑行者及其他道路元素等对象的详细标注。数据集主要分为两个子集:

  • 训练集: 包含 5,985 张带有标注标签的图像,用于模型训练。
  • 验证集: 包含 1,496 张带有相应标注的图像,用于性能评估和基准测试。

应用场景

kitti 数据集推动了自动驾驶和机器人技术的发展,支持以下任务:

  • 自动驾驶感知: 训练模型以检测和跟踪车辆、行人和障碍物,从而实现自动驾驶系统中的安全导航。
  • 3D 场景理解: 支持深度估计、立体视觉和 3D 目标定位,帮助机器理解空间环境。
  • 光流和运动预测: 支持运动分析,以预测物体运动并改进动态环境中的轨迹规划。
  • 计算机视觉基准测试: 作为评估目标检测和跟踪等多项视觉任务性能的标准基准。

数据集 YAML

Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类标签和元数据。配置文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取。

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

使用方法

要在 kitti 数据集上训练 YOLO26n 模型并运行 100 个 epochs,图像尺寸为 640,请使用以下命令。更多详细信息,请参阅 Training 页面。

训练示例
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

你也可以使用相同的配置文件,直接通过命令行或 Python API 执行评估、inferenceexport 任务。

样本图像和标注

kitti 数据集提供了多种驾驶场景。每张图像都包含用于 2D 目标检测任务的边界框(bounding box)标注。这些示例展示了数据集的丰富多样性,使模型能够在多样的真实世界条件下实现稳健的泛化。

KITTI dataset vehicle detection sample

引文与致谢

如果你在研究中使用 kitti 数据集,请引用以下论文:

引用
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

我们感谢 KITTI Vision Benchmark Suite 提供的这一综合数据集,它持续推动着计算机视觉、机器人和自动系统领域的发展。访问 kitti 网站 以获取更多信息。

常见问题解答 (FAQs)

kitti 数据集有什么用途?

kitti 数据集主要用于自动驾驶领域的计算机视觉研究,支持目标检测、深度估计、光流和 3D 定位等任务。

kitti 数据集中包含多少张图像?

该数据集包含 5,985 张带标注的训练图像和 1,496 张验证图像,涵盖了城市、乡村和高速公路场景。原始测试集因不含真实标注,此处不予包含。

数据集中标注了哪些对象类别?

kitti 包含对汽车、行人、骑行者、卡车、有轨电车及各类道路使用者的标注。

我可以使用 kitti 数据集训练 Ultralytics YOLO26 模型吗?

是的,kitti 与 Ultralytics YOLO26 完全兼容。你可以直接使用提供的 YAML 配置文件来 trainvalidate 模型。

在哪里可以找到 kitti 数据集配置文件?

你可以通过 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 访问该 YAML 文件。

评论