KITTI 数据集

KITTI 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。它由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所发布，包含从真实驾驶场景中收集的立体相机、激光雷达和 GPS/IMU 数据。

观看： 如何在KITTI数据集上训练Ultralytics YOLO26 🚀

它广泛用于评估目标检测、深度估计、光流和视觉里程计算法。该数据集与Ultralytics YOLO26完全兼容，适用于2D目标检测任务，并且可以轻松集成到Ultralytics平台进行训练和评估。

数据集结构

警告

Kitti 原始测试集在此处被排除，因为它不包含真实标注。

总计，该数据集包含7,481张图像，每张图像都配有详细的标注，用于汽车、行人、骑行者和其他道路元素等对象。该数据集分为两个主要子集：

训练集：包含 5,985 张带有标注标签的图像，用于模型训练。
验证集: 包含1,496张带有相应标注的图像，用于性能评估和基准测试。

应用

KITTI 数据集推动了自动驾驶和机器人技术的发展，支持以下任务：

自动驾驶车辆感知：训练模型以 detect 和 track 车辆、行人及障碍物，以实现自动驾驶系统中的安全导航。
3D 场景理解：支持深度估计、立体视觉和 3D 对象定位，以帮助机器理解空间环境。
光流和运动预测：实现运动分析，以预测物体的运动并改善动态环境中的轨迹规划。
计算机视觉基准测试：作为评估多种视觉任务（包括目标检测和 track）性能的标准基准。

数据集 YAML

Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类别标签和元数据。配置文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取。

Ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

用法

要在kitti数据集上训练一个图像大小为640、迭代100个epoch的YOLO26n模型，请使用以下命令。欲了解更多详情，请参阅训练页面。

训练示例

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

yolo detect train data=kitti.yaml model=yolo26n.pt epochs=100 imgsz=640

您还可以使用相同的配置文件，直接通过命令行或 Python API 执行评估、推理和导出任务。

Sample Images 和注释

Kitti数据集提供了多样化的驾驶场景。每张图像都包含用于二维目标检测任务的边界框标注。这些示例充分展现了数据集的丰富多样性，使模型能够在各种真实世界条件下实现强大的泛化能力。

KITTI数据集车辆检测样本

引用和致谢

如果您在研究中使用kitti数据集，请引用以下论文：

引用

BibTeX

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

我们感谢 KITTI 视觉基准套件提供了这个全面的数据集，该数据集持续推动着计算机视觉、机器人技术和自主系统领域的发展。访问kitti 网站了解更多信息。

常见问题

kitti数据集用于什么？

kitti数据集主要用于自动驾驶领域的计算机视觉研究，支持目标检测、深度估计、光流和3D定位等任务。

KITTI数据集中包含多少图像？

该数据集包含5,985张带标签的训练图像和1,496张验证图像，这些图像捕获自城市、乡村和高速公路场景。原始测试集在此处被排除，因为它不包含真实标注。

数据集中标注了哪些对象类别？

Kitti 包含对诸如汽车、行人、骑行者、卡车、有轨电车以及其他道路使用者等对象的标注。

我可以使用kitti数据集训练Ultralytics YOLO26模型吗？

是的，kitti与Ultralytics YOLO26完全兼容。您可以使用提供的yaml配置文件直接训练和验证模型。

在哪里可以找到 kitti 数据集配置文件？

您可以访问位于https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml的yaml文件。

📅 创建于 3 个月前 ✏️ 更新于 16 天前