跳转至内容

KITTI 数据集

在Colab中打开KITTI数据集

KITTI 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。它由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所发布,包含从真实驾驶场景中收集的立体相机、激光雷达和 GPS/IMU 数据。



观看: 如何在 KITTI 数据集上训练 Ultralytics YOLO11 🚀

它广泛用于评估目标检测、深度估计、光流和视觉里程计中的算法。该数据集与 Ultralytics YOLO11 完全兼容,适用于 2D 目标检测任务,并且可以轻松集成到 Ultralytics 平台进行训练和评估。

数据集结构

警告

Kitti 原始测试集在此处被排除,因为它不包含真实标注。

总计,该数据集包含7,481张图像,每张图像都配有详细的标注,用于汽车、行人、骑行者和其他道路元素等对象。该数据集分为两个主要子集:

  • 训练集:包含 5,985 张带有标注标签的图像,用于模型训练。
  • 验证集: 包含1,496张带有相应标注的图像,用于性能评估和基准测试。

应用

KITTI 数据集推动了自动驾驶和机器人技术的发展,支持以下任务:

  • 自动驾驶车辆感知:训练模型以 detect 和 track 车辆、行人及障碍物,以实现自动驾驶系统中的安全导航。
  • 3D 场景理解:支持深度估计、立体视觉和 3D 对象定位,以帮助机器理解空间环境。
  • 光流和运动预测:实现运动分析,以预测物体的运动并改善动态环境中的轨迹规划。
  • 计算机视觉基准测试:作为评估多种视觉任务(包括目标检测和 track)性能的标准基准。

数据集 YAML

Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类别标签和元数据。配置文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取。

Ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

用法

要在 kitti 数据集上训练 YOLO11n 模型,进行 100 个 epoch,图像尺寸为 640,请使用以下命令。有关更多详细信息,请参阅训练页面。

训练示例

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

您还可以使用相同的配置文件,直接从命令行或Python API 执行评估、推理导出任务。

Sample Images 和注释

kitti数据集提供了多样化的驾驶场景。每张图像都包含用于2D目标检测任务的边界框标注。这些示例展示了数据集的丰富多样性,使模型能够在各种真实世界条件下实现鲁棒的泛化。

Kitti 示例图像

引用和致谢

如果您在研究中使用kitti数据集,请引用以下论文:

引用

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

我们感谢 KITTI 视觉基准套件提供了这个全面的数据集,该数据集持续推动着计算机视觉、机器人技术和自主系统领域的发展。访问kitti 网站了解更多信息。

常见问题

kitti数据集用于什么?

kitti数据集主要用于自动驾驶领域的计算机视觉研究,支持目标检测、深度估计、光流和3D定位等任务。

KITTI数据集中包含多少图像?

该数据集包含5,985张带标签的训练图像和1,496张验证图像,这些图像捕获自城市、乡村和高速公路场景。原始测试集在此处被排除,因为它不包含真实标注。

数据集中标注了哪些对象类别?

Kitti 包含对诸如汽车、行人、骑行者、卡车、有轨电车以及其他道路使用者等对象的标注。

我可以使用 kitti 数据集训练 Ultralytics YOLO11 模型吗?

是的,kitti 完全兼容 Ultralytics YOLO11。您可以直接使用提供的 YAML 配置文件训练验证模型。

在哪里可以找到 kitti 数据集配置文件?

您可以访问yaml 上的 YAML 文件。



📅 1 个月前创建 ✏️ 1 个月前更新
RizwanMunawar

评论