Meet YOLO26: next-gen vision AI.

Link to this sectionKITTI 数据集#

Open KITTI Dataset In Colab

kitti 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。它由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所联合发布,包含从真实驾驶场景中采集的立体相机、LiDAR 和 GPS/IMU 数据。



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

它被广泛用于评估目标检测、深度估计、光流和视觉里程计等算法。该数据集与 Ultralytics YOLO26 完全兼容,可用于 2D 目标检测任务,并能轻松集成到 Ultralytics 平台中进行训练和评估。

Link to this section数据集结构#

警告

由于 kitti 的原始测试集不包含真实标注(ground-truth annotations),因此此处将其排除在外。

该数据集共包含 7,481 张图像,每张图像都配有针对汽车、行人、骑行者及其他道路元素等对象的详细标注。数据集主要分为两个子集:

  • 训练集: 包含 5,985 张带有标注标签的图像,用于模型训练。
  • 验证集: 包含 1,496 张带有相应标注的图像,用于性能评估和基准测试。

Link to this section应用场景#

kitti 数据集推动了自动驾驶和机器人技术的发展,支持以下任务:

  • 自动驾驶感知: 训练模型以检测和跟踪车辆、行人和障碍物,从而实现自动驾驶系统中的安全导航。
  • 3D 场景理解: 支持深度估计、立体视觉和 3D 目标定位,帮助机器理解空间环境。
  • 光流和运动预测: 支持运动分析,以预测物体运动并改进动态环境中的轨迹规划。
  • 计算机视觉基准测试: 作为评估目标检测和跟踪等多项视觉任务性能的标准基准。

Link to this section数据集 YAML#

Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类标签和元数据。配置文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取。

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Link to this section使用方法#

要在 kitti 数据集上训练 YOLO26n 模型并运行 100 个 epochs,图像尺寸为 640,请使用以下命令。更多详细信息,请参阅 Training 页面。

训练示例
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

你也可以使用相同的配置文件,直接通过命令行或 Python API 执行评估、inferenceexport 任务。

Link to this section样本图像和标注#

kitti 数据集提供了多种驾驶场景。每张图像都包含用于 2D 目标检测任务的边界框(bounding box)标注。这些示例展示了数据集的丰富多样性,使模型能够在多样的真实世界条件下实现稳健的泛化。

KITTI dataset vehicle detection sample

Link to this section引文与致谢#

如果你在研究中使用 kitti 数据集,请引用以下论文:

引用
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

我们感谢 KITTI Vision Benchmark Suite 提供的这一综合数据集,它持续推动着计算机视觉、机器人和自动系统领域的发展。访问 kitti 网站 以获取更多信息。

Link to this section常见问题解答 (FAQs)#

Link to this sectionkitti 数据集有什么用途?#

kitti 数据集主要用于自动驾驶领域的计算机视觉研究,支持目标检测、深度估计、光流和 3D 定位等任务。

Link to this sectionkitti 数据集中包含多少张图像?#

该数据集包含 5,985 张带标注的训练图像和 1,496 张验证图像,涵盖了城市、乡村和高速公路场景。原始测试集因不含真实标注,此处不予包含。

Link to this section数据集中标注了哪些对象类别?#

kitti 包含对汽车、行人、骑行者、卡车、有轨电车及各类道路使用者的标注。

Link to this section我可以使用 kitti 数据集训练 Ultralytics YOLO26 模型吗?#

是的,kitti 与 Ultralytics YOLO26 完全兼容。你可以直接使用提供的 YAML 配置文件来 trainvalidate 模型。

Link to this section在哪里可以找到 kitti 数据集配置文件?#

你可以通过 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 访问该 YAML 文件。

贡献者

评论