Ir al contenido

Conjunto de datos KITTI

Abrir el conjunto de datos KITTI en Colab

El conjunto de datos kitti es uno de los conjuntos de datos de referencia más influyentes para la conducción autónoma y la visión artificial. Publicado por el Instituto de Tecnología de Karlsruhe y el Instituto Tecnológico de Toyota en Chicago, contiene datos de cámara estéreo, LiDAR y GPS/IMU recopilados de escenarios de conducción del mundo real.



Ver: Cómo entrenar Ultralytics YOLO11 en el conjunto de datos KITTI 🚀

Se utiliza ampliamente para evaluar algoritmos en la detection de objetos, la estimación de profundidad, el flujo óptico y la odometría visual. El conjunto de datos es totalmente compatible con Ultralytics YOLO11 para tareas de detection de objetos 2D y se puede integrar fácilmente en la plataforma Ultralytics para el entrenamiento y la evaluación.

Estructura del conjunto de datos

Advertencia

El conjunto de pruebas original de Kitti se excluye aquí ya que no contiene anotaciones de ground-truth.

En total, el conjunto de datos incluye 7.481 imágenes, cada una de ellas emparejada con anotaciones detalladas para objetos como coches, peatones, ciclistas y otros elementos de la carretera. El conjunto de datos se divide en dos subconjuntos principales:

  • Conjunto de entrenamiento: Contiene 5.985 imágenes con etiquetas anotadas utilizadas para el entrenamiento del modelo.
  • Conjunto de validación: Incluye 1,496 imágenes con las anotaciones correspondientes utilizadas para la evaluación del rendimiento y la evaluación comparativa.

Aplicaciones

El conjunto de datos Kitti permite avances en la conducción autónoma y la robótica, apoyando tareas como:

  • Percepción de vehículos autónomos: Modelos de entrenamiento para detect y track vehículos, peatones y obstáculos para una navegación segura en sistemas de conducción autónoma.
  • Comprensión de la escena 3D: Soporte para la estimación de profundidad, visión estéreo y localización de objetos 3D para ayudar a las máquinas a entender los entornos espaciales.
  • Flujo óptico y predicción de movimiento: Permite el análisis del movimiento para predecir el movimiento de los objetos y mejorar la planificación de la trayectoria en entornos dinámicos.
  • Evaluación comparativa de visión artificial: Sirve como un punto de referencia estándar para evaluar el rendimiento en múltiples tareas de visión, incluyendo la detección de objetos y el seguimiento (tracking).

YAML del conjunto de datos

Ultralytics define la configuración del conjunto de datos kitti utilizando un archivo YAML. Este archivo especifica las rutas del conjunto de datos, las etiquetas de clase y los metadatos necesarios para el entrenamiento. El archivo de configuración está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Uso

Para entrenar un modelo YOLO11n en el conjunto de datos kitti durante 100 épocas con un tamaño de imagen de 640, utilice los siguientes comandos. Para obtener más detalles, consulte la página de Entrenamiento.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

También puede realizar tareas de evaluación, Inference y exportación directamente desde la línea de comandos o la API de python utilizando el mismo archivo de configuración.

sample_images y anotaciones

El conjunto de datos kitti proporciona diversos escenarios de conducción. Cada imagen incluye anotaciones de cuadro delimitador para tareas de detección de objetos 2D. El ejemplo muestra la rica variedad del conjunto de datos, lo que permite una generalización robusta del modelo en diversas condiciones del mundo real.

Imagen de muestra de Kitti

Citas y agradecimientos

Si utiliza el dataset kitti en su investigación, cite el siguiente artículo:

Cita

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Agradecemos a KITTI Vision Benchmark Suite por proporcionar este conjunto de datos completo que continúa dando forma al progreso en visión artificial, robótica y sistemas autónomos. Visite el sitio web de kitti para obtener más información.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos kitti?

El conjunto de datos kitti se utiliza principalmente para la investigación de visión artificial en la conducción autónoma, lo que respalda tareas como la detección de objetos, la estimación de profundidad, el flujo óptico y la localización 3D.

¿Cuántas imágenes se incluyen en el conjunto de datos kitti?

El conjunto de datos incluye 5.985 imágenes de entrenamiento etiquetadas y 1.496 imágenes de validación capturadas en escenas urbanas, rurales y de autopistas. El conjunto de pruebas original se excluye aquí, ya que no contiene anotaciones de referencia.

¿Qué clases de objetos se anotan en el conjunto de datos?

kitti incluye anotaciones para objetos como coches, peatones, ciclistas, camiones, tranvías y usuarios de la carretera diversos.

¿Puedo entrenar modelos Ultralytics YOLO11 utilizando el conjunto de datos kitti?

Sí, kitti es totalmente compatible con Ultralytics YOLO11. Puede entrenar y validar modelos directamente utilizando el archivo de configuración YAML proporcionado.

¿Dónde puedo encontrar el archivo de configuración del conjunto de datos kitti?

Puede acceder al archivo YAML en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.



📅 Creado hace 1 mes ✏️ Actualizado hace 1 mes
RizwanMunawar

Comentarios