Ir al contenido

Conjunto de datos KITTI

El conjunto de datos kitti es uno de los más influyentes para la conducción autónoma y la visión por ordenador. Publicado por el Instituto de Tecnología de Karlsruhe y el Instituto Tecnológico Toyota de Chicago, contiene datos de cámaras estéreo, LiDAR y GPS/IMU recogidos en situaciones de conducción real.

Se utiliza ampliamente para evaluar algoritmos de detección de objetos, estimación de profundidad, flujo óptico y odometría visual. El conjunto de datos es totalmente compatible con Ultralytics YOLO11 para tareas de detección de objetos en 2D y puede integrarse fácilmente en la plataforma Ultralytics para su formación y evaluación.

Estructura del conjunto de datos

Advertencia

Se excluye el conjunto de pruebas original de Kitti, ya que no contiene anotaciones reales.

En total, el conjunto de datos incluye 7.481 imágenes, cada una emparejada con anotaciones detalladas de objetos como coches, peatones, ciclistas y otros elementos de la carretera. El conjunto de datos se divide en dos subconjuntos principales:

  • Conjunto de entrenamiento: Contiene 5.985 imágenes con etiquetas anotadas utilizadas para el entrenamiento del modelo.
  • Conjunto de validación: Incluye 1.496 imágenes con las anotaciones correspondientes utilizadas para la evaluación del rendimiento y la evaluación comparativa.

Aplicaciones

El conjunto de datos Kitti permite avances en conducción autónoma y robótica, apoyando tareas como:

  • Percepción de vehículos autónomos: Entrenamiento de modelos de detección y seguimiento de vehículos, peatones y obstáculos para una navegación segura en sistemas de conducción autónoma.
  • Comprensión de escenas 3D: Estimación de la profundidad, visión estereoscópica y localización de objetos 3D para ayudar a las máquinas a comprender entornos espaciales.
  • Predicción óptica de flujo y movimiento: Habilitación del análisis de movimiento para predecir el movimiento de objetos y mejorar la planificación de trayectorias en entornos dinámicos.
  • Evaluación comparativa de la visión por ordenador: Sirve de referencia estándar para evaluar el rendimiento en múltiples tareas de visión, como la detección y el seguimiento de objetos.

YAML del conjunto de datos

Ultralytics define la configuración del conjunto de datos kitti mediante un archivo YAML. Este archivo especifica las rutas de los conjuntos de datos, las etiquetas de las clases y los metadatos necesarios para el entrenamiento. El archivo de configuración está disponible en ultralytics

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Uso

Para entrenar un modelo YOLO11n en el conjunto de datos kitti durante 100 épocas con un tamaño de imagen de 640, utilice los siguientes comandos. Para más detalles, consulte la página de entrenamiento.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

También puede realizar tareas de evaluación, inferencia y exportación directamente desde la línea de comandos o la API de Python utilizando el mismo archivo de configuración.

sample_images y anotaciones

El conjunto de datos kitti ofrece diversos escenarios de conducción. Cada imagen incluye anotaciones de cuadro delimitador para tareas de detección de objetos en 2D. El ejemplo muestra la gran variedad del conjunto de datos, lo que permite una generalización sólida del modelo en diversas condiciones del mundo real.

Kitti imagen de muestra

Citas y agradecimientos

Si utiliza el conjunto de datos kitti en su investigación, cite el siguiente documento:

Cita

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Damos las gracias a KITTI Vision Benchmark Suite por proporcionarnos este completo conjunto de datos que sigue dando forma a los avances en visión por ordenador, robótica y sistemas autónomos. Visite el sitio web de kitti para obtener más información.

Preguntas frecuentes

¿Para qué se utiliza el conjunto de datos kitti?

El conjunto de datos kitti se utiliza principalmente para la investigación de la visión por ordenador en la conducción autónoma, con tareas como la detección de objetos, la estimación de la profundidad, el flujo óptico y la localización 3D.

¿Cuántas imágenes incluye el conjunto de datos kitti?

El conjunto de datos incluye 5.985 imágenes de entrenamiento etiquetadas y 1.496 imágenes de validación capturadas en escenas urbanas, rurales y de carretera. Se excluye el conjunto de pruebas original, ya que no contiene anotaciones reales.

¿Qué clases de objetos están anotadas en el conjunto de datos?

kitti incluye anotaciones para objetos como coches, peatones, ciclistas, camiones, tranvías y diversos usuarios de la carretera.

¿Puedo entrenar los modelosYOLO11 Ultralytics con el conjunto de datos kitti?

Sí, kitti es totalmente compatible con Ultralytics YOLO11. Puede entrenar y validar modelos directamente utilizando el archivo de configuración YAML proporcionado.

¿Dónde puedo encontrar el archivo de configuración del conjunto de datos kitti?

Puede acceder al archivo YAML en ultralytics



📅 Creado hace 0 días ✏️ Actualizado hace 0 días

Comentarios