Dataset KITTI

Open KITTI Dataset In Colab

El dataset kitti es uno de los datasets de referencia más influyentes para la conducción autónoma y la visión artificial. Publicado por el Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico Toyota en Chicago, contiene datos de cámaras estéreo, LiDAR y GPS/IMU recopilados en escenarios de conducción del mundo real.



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

Se utiliza ampliamente para evaluar algoritmos en detección de objetos, estimación de profundidad, flujo óptico y odometría visual. El dataset es totalmente compatible con Ultralytics YOLO26 para tareas de detección de objetos 2D y puede integrarse fácilmente en la plataforma Ultralytics para entrenamiento y evaluación.

Estructura del conjunto de datos

Advertencia

El conjunto de prueba original de kitti se excluye aquí, ya que no contiene anotaciones de la verdad fundamental (ground-truth).

En total, el dataset incluye 7481 imágenes, cada una emparejada con anotaciones detalladas para objetos como coches, peatones, ciclistas y otros elementos de la carretera. El dataset se divide en dos subconjuntos principales:

  • Conjunto de entrenamiento: Contiene 5985 imágenes con etiquetas anotadas utilizadas para el entrenamiento del modelo.
  • Conjunto de validación: Incluye 1496 imágenes con las anotaciones correspondientes utilizadas para la evaluación del rendimiento y la evaluación comparativa (benchmarking).

Aplicaciones

El dataset kitti permite avances en la conducción autónoma y la robótica, apoyando tareas como:

  • Percepción de vehículos autónomos: Entrenar modelos para detectar y seguir vehículos, peatones y obstáculos para una navegación segura en sistemas de conducción autónoma.
  • Comprensión de escenas 3D: Apoyar la estimación de profundidad, la visión estéreo y la localización de objetos en 3D para ayudar a las máquinas a entender los entornos espaciales.
  • Flujo óptico y predicción de movimiento: Permitir el análisis de movimiento para predecir el movimiento de objetos y mejorar la planificación de trayectorias en entornos dinámicos.
  • Evaluación comparativa de visión artificial: Servir como estándar para evaluar el rendimiento en múltiples tareas de visión, incluyendo la detección y el seguimiento de objetos.

YAML del conjunto de datos

Ultralytics define la configuración del dataset kitti mediante un archivo YAML. Este archivo especifica las rutas del dataset, las etiquetas de clase y los metadatos necesarios para el entrenamiento. El archivo de configuración está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Uso

Para entrenar un modelo YOLO26n en el dataset kitti durante 100 epochs con un tamaño de imagen de 640, utiliza los siguientes comandos. Para obtener más detalles, consulta la página de Entrenamiento.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

También puedes realizar tareas de evaluación, inferencia y exportación directamente desde la línea de comandos o la API de Python utilizando el mismo archivo de configuración.

Imágenes y anotaciones de muestra

El dataset kitti proporciona diversos escenarios de conducción. Cada imagen incluye anotaciones de cajas delimitadoras (bounding boxes) para tareas de detección de objetos en 2D. Los ejemplos muestran la gran variedad del dataset, permitiendo una generalización robusta del modelo en diversas condiciones del mundo real.

KITTI dataset vehicle detection sample

Citas y reconocimientos

Si utilizas el dataset kitti en tu investigación, por favor cita el siguiente artículo:

Cita
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Reconocemos al KITTI Vision Benchmark Suite por proporcionar este dataset completo que continúa dando forma al progreso en la visión artificial, la robótica y los sistemas autónomos. Visita el sitio web de kitti para más información.

Preguntas frecuentes

¿Para qué se utiliza el dataset kitti?

El dataset kitti se utiliza principalmente para la investigación en visión artificial en la conducción autónoma, apoyando tareas como la detección de objetos, la estimación de profundidad, el flujo óptico y la localización 3D.

¿Cuántas imágenes incluye el dataset kitti?

El dataset incluye 5985 imágenes de entrenamiento etiquetadas y 1496 imágenes de validación capturadas en escenas urbanas, rurales y de autopista. El conjunto de prueba original se excluye aquí ya que no contiene anotaciones de ground-truth.

¿Qué clases de objetos están anotadas en el dataset?

kitti incluye anotaciones para objetos como coches, peatones, ciclistas, camiones, tranvías y otros usuarios de la carretera.

¿Puedo entrenar modelos Ultralytics YOLO26 usando el dataset kitti?

Sí, kitti es totalmente compatible con Ultralytics YOLO26. Puedes entrenar y validar modelos directamente utilizando el archivo de configuración YAML proporcionado.

¿Dónde puedo encontrar el archivo de configuración del dataset kitti?

Puedes acceder al archivo YAML en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

Comentarios