Conjunto de datos KITTI

El conjunto de datos kitti es uno de los conjuntos de datos de referencia más influyentes para la conducción autónoma y la visión artificial. Publicado por el Instituto de Tecnología de Karlsruhe y el Instituto Tecnológico de Toyota en Chicago, contiene datos de cámara estéreo, LiDAR y GPS/IMU recopilados de escenarios de conducción del mundo real.

Ver: Cómo entrenar Ultralytics YOLO26 en el conjunto de datos KITTI 🚀

Es ampliamente utilizado para evaluar algoritmos en detección de objetos, estimación de profundidad, flujo óptico y odometría visual. El conjunto de datos es totalmente compatible con Ultralytics YOLO26 para tareas de detección de objetos 2D y puede integrarse fácilmente en la plataforma Ultralytics para entrenamiento y evaluación.

Estructura del conjunto de datos

Advertencia

El conjunto de pruebas original de Kitti se excluye aquí ya que no contiene anotaciones de ground-truth.

En total, el conjunto de datos incluye 7.481 imágenes, cada una de ellas emparejada con anotaciones detalladas para objetos como coches, peatones, ciclistas y otros elementos de la carretera. El conjunto de datos se divide en dos subconjuntos principales:

Conjunto de entrenamiento: Contiene 5.985 imágenes con etiquetas anotadas utilizadas para el entrenamiento del modelo.
Conjunto de validación: Incluye 1,496 imágenes con las anotaciones correspondientes utilizadas para la evaluación del rendimiento y la evaluación comparativa.

Aplicaciones

El conjunto de datos Kitti permite avances en la conducción autónoma y la robótica, apoyando tareas como:

Percepción de vehículos autónomos: Modelos de entrenamiento para detect y track vehículos, peatones y obstáculos para una navegación segura en sistemas de conducción autónoma.
Comprensión de la escena 3D: Soporte para la estimación de profundidad, visión estéreo y localización de objetos 3D para ayudar a las máquinas a entender los entornos espaciales.
Flujo óptico y predicción de movimiento: Permite el análisis del movimiento para predecir el movimiento de los objetos y mejorar la planificación de la trayectoria en entornos dinámicos.
Evaluación comparativa de visión artificial: Sirve como un punto de referencia estándar para evaluar el rendimiento en múltiples tareas de visión, incluyendo la detección de objetos y el seguimiento (tracking).

YAML del conjunto de datos

Ultralytics define la configuración del conjunto de datos kitti utilizando un archivo YAML. Este archivo especifica las rutas del conjunto de datos, las etiquetas de clase y los metadatos necesarios para el entrenamiento. El archivo de configuración está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Uso

Para entrenar un modelo YOLO26n en el conjunto de datos kitti durante 100 épocas con un tamaño de imagen de 640, utilice los siguientes comandos. Para más detalles, consulte la página de Entrenamiento.

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

yolo detect train data=kitti.yaml model=yolo26n.pt epochs=100 imgsz=640

También puede realizar tareas de evaluación, Inference y exportación directamente desde la línea de comandos o la API de python utilizando el mismo archivo de configuración.

sample_images y anotaciones

El conjunto de datos kitti ofrece diversos escenarios de conducción. Cada imagen incluye anotaciones de cuadros delimitadores para tareas de detección de objetos en 2D. Los ejemplos muestran la gran variedad del conjunto de datos, lo que permite una generalización robusta del modelo en diversas condiciones del mundo real.

Muestra de detección de vehículos del conjunto de datos KITTI

Citas y agradecimientos

Si utiliza el dataset kitti en su investigación, cite el siguiente artículo:

Cita

BibTeX

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Agradecemos a KITTI Vision Benchmark Suite por proporcionar este conjunto de datos completo que continúa dando forma al progreso en visión artificial, robótica y sistemas autónomos. Visite el sitio web de kitti para obtener más información.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos kitti?

El conjunto de datos kitti se utiliza principalmente para la investigación de visión artificial en la conducción autónoma, lo que respalda tareas como la detección de objetos, la estimación de profundidad, el flujo óptico y la localización 3D.

¿Cuántas imágenes se incluyen en el conjunto de datos kitti?

El conjunto de datos incluye 5.985 imágenes de entrenamiento etiquetadas y 1.496 imágenes de validación capturadas en escenas urbanas, rurales y de autopistas. El conjunto de pruebas original se excluye aquí, ya que no contiene anotaciones de referencia.

¿Qué clases de objetos se anotan en el conjunto de datos?

kitti incluye anotaciones para objetos como coches, peatones, ciclistas, camiones, tranvías y usuarios de la carretera diversos.

¿Puedo entrenar modelos Ultralytics YOLO26 usando el conjunto de datos kitti?

Sí, kitti es totalmente compatible con Ultralytics YOLO26. Puede entrenar y validar modelos directamente utilizando el archivo de configuración YAML proporcionado.

¿Dónde puedo encontrar el archivo de configuración del conjunto de datos kitti?

Puede acceder al archivo YAML en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

📅 Creado hace 3 meses ✏️ Actualizado hace 16 días