Link to this sectionKITTI 数据集#
kitti 数据集是自动驾驶和计算机视觉领域最具影响力的基准数据集之一。该数据集由卡尔斯鲁厄理工学院和芝加哥丰田技术学院发布,包含从真实驾驶场景中收集的立体相机、LiDAR 以及 GPS/IMU 数据。
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
它被广泛用于评估目标检测、深度估计、光流和视觉里程计方面的算法。该数据集与 Ultralytics YOLO26 完全兼容,可用于 2D 目标检测任务,并能轻松集成到 Ultralytics 平台中进行训练和评估。
Link to this section数据集结构#
此处不包含 kitti 原始测试集,因为它没有真实标签(ground-truth annotations)。
该数据集总共包含 7,481 张图像,每张图像都配有针对汽车、行人、骑行者和其他道路元素等对象的详细标注。数据集分为两个主要子集:
- 训练集: 包含 5,985 张带有标注标签的图像,用于模型训练。
- 验证集: 包含 1,496 张带有相应标注的图像,用于性能评估和基准测试。
Link to this section应用#
kitti 数据集推动了自动驾驶和机器人技术的发展,支持以下任务:
- 自动驾驶感知:训练模型以检测和追踪车辆、行人和障碍物,从而实现自动驾驶系统中的安全导航。
- 3D 场景理解:支持深度估计、立体视觉和 3D 目标定位,帮助机器理解空间环境。
- 光流与运动预测:实现运动分析以预测对象的移动,并改善动态环境中的轨迹规划。
- 计算机视觉基准测试:作为评估目标检测和追踪等多种视觉任务性能的标准基准。
Link to this section数据集 YAML#
Ultralytics 使用 YAML 文件定义 kitti 数据集配置。该文件指定了训练所需的数据集路径、类别标签和元数据。配置文件位于 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipLink to this section用法#
要使用 640 的图像尺寸在 kitti 数据集上训练 YOLO26n 模型 100 个 epoch,请使用以下命令。更多详细信息,请参阅 训练 页面。
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)你也可以使用相同的配置文件,直接通过命令行或 Python API 执行评估、推理 和 导出 任务。
Link to this section样本图像和标注#
kitti 数据集提供了多样化的驾驶场景。每张图像都包含用于 2D 目标检测任务的 bbox 标注。这些示例展示了数据集的丰富多样性,使模型能够在各种现实世界条件下实现稳健的泛化。
Link to this section引用与致谢#
如果你在研究中使用 kitti 数据集,请引用以下论文:
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}我们感谢 KITTI Vision Benchmark Suite 提供的这一综合性数据集,它持续推动着计算机视觉、机器人技术和自动驾驶系统的进步。访问 kitti 网站 以获取更多信息。
Link to this section常见问题解答 (FAQs)#
Link to this sectionkitti 数据集有什么用途?#
kitti 数据集主要用于自动驾驶领域的计算机视觉研究,支持目标检测、深度估计、光流和 3D 定位等任务。
Link to this sectionkitti 数据集中包含多少张图像?#
该数据集包括 5,985 张带标签的训练图像和 1,496 张验证图像,这些图像捕捉自城市、乡村和高速公路场景。此处排除了原始测试集,因为它不包含真实标签。
Link to this section数据集中标注了哪些对象类别?#
kitti 包含对汽车、行人、骑行者、卡车、电车和其他道路使用者的标注。
Link to this section我可以使用 kitti 数据集训练 Ultralytics YOLO26 模型吗?#
是的,kitti 与 Ultralytics YOLO26 完全兼容。你可以直接使用提供的 YAML 配置文件来 训练 和 验证 模型。
Link to this section在哪里可以找到 kitti 数据集的配置文件?#
你可以访问 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml 获取 YAML 文件。