Link to this sectionConjunto de datos KITTI#
El conjunto de datos kitti es uno de los datasets de referencia más influyentes para la conducción autónoma y la visión artificial. Publicado por el Instituto Tecnológico de Karlsruhe y el Instituto Tecnológico de Toyota en Chicago, contiene datos de cámaras estéreo, LiDAR y GPS/IMU recopilados en escenarios de conducción del mundo real.
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
Se utiliza ampliamente para evaluar algoritmos en detección de objetos, estimación de profundidad, flujo óptico y odometría visual. El conjunto de datos es totalmente compatible con Ultralytics YOLO26 para tareas de detección de objetos 2D y puede integrarse fácilmente en la plataforma Ultralytics para su entrenamiento y evaluación.
Link to this sectionEstructura del dataset#
El conjunto de prueba original de kitti se excluye aquí ya que no contiene anotaciones de verdad fundamental.
En total, el conjunto de datos incluye 7,481 imágenes, cada una emparejada con anotaciones detalladas de objetos como coches, peatones, ciclistas y otros elementos de la carretera. El conjunto de datos se divide en dos subconjuntos principales:
- Conjunto de entrenamiento: Contiene 5,985 imágenes con etiquetas anotadas utilizadas para el entrenamiento del modelo.
- Conjunto de validación: Incluye 1,496 imágenes con sus correspondientes anotaciones utilizadas para la evaluación del rendimiento y la evaluación comparativa.
Link to this sectionAplicaciones#
El conjunto de datos kitti permite avances en la conducción autónoma y la robótica, dando soporte a tareas como:
- Percepción de vehículos autónomos: Entrenar modelos para detectar y rastrear vehículos, peatones y obstáculos para una navegación segura en sistemas de conducción autónoma.
- Comprensión de escenas 3D: Dar soporte a la estimación de profundidad, visión estéreo y localización de objetos 3D para ayudar a las máquinas a entender los entornos espaciales.
- Flujo óptico y predicción de movimiento: Permitir el análisis de movimiento para predecir el desplazamiento de objetos y mejorar la planificación de trayectorias en entornos dinámicos.
- Evaluación comparativa de visión artificial: Servir como referencia estándar para evaluar el rendimiento en múltiples tareas de visión, incluyendo la detección y el rastreo de objetos.
Link to this sectionYAML del dataset#
Ultralytics define la configuración del conjunto de datos kitti mediante un archivo YAML. Este archivo especifica las rutas del conjunto de datos, las etiquetas de clase y los metadatos necesarios para el entrenamiento. El archivo de configuración está disponible en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipLink to this sectionUso#
Para entrenar un modelo YOLO26n en el conjunto de datos kitti durante 100 epochs con un tamaño de imagen de 640, utiliza los siguientes comandos. Para más detalles, consulta la página de Entrenamiento.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)También puedes realizar tareas de evaluación, inferencia y exportación directamente desde la línea de comandos o la API de Python utilizando el mismo archivo de configuración.
Link to this sectionMuestras de imágenes y anotaciones#
El conjunto de datos kitti ofrece diversos escenarios de conducción. Cada imagen incluye anotaciones de caja delimitadora para tareas de detección de objetos 2D. Los ejemplos muestran la gran variedad del conjunto de datos, lo que permite una generalización robusta del modelo en diversas condiciones del mundo real.
Link to this sectionCitas y agradecimientos#
Si utilizas el conjunto de datos kitti en tu investigación, por favor cita el siguiente artículo:
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}Reconocemos al KITTI Vision Benchmark Suite por proporcionar este conjunto de datos integral que continúa impulsando el progreso en visión artificial, robótica y sistemas autónomos. Visita el sitio web de kitti para más información.
Link to this sectionPreguntas frecuentes#
Link to this section¿Para qué se utiliza el conjunto de datos kitti?#
El conjunto de datos kitti se utiliza principalmente para la investigación en visión artificial aplicada a la conducción autónoma, dando soporte a tareas como la detección de objetos, la estimación de profundidad, el flujo óptico y la localización 3D.
Link to this section¿Cuántas imágenes incluye el conjunto de datos kitti?#
El conjunto de datos incluye 5,985 imágenes de entrenamiento etiquetadas y 1,496 imágenes de validación capturadas en escenas urbanas, rurales y de autopista. El conjunto de prueba original se excluye aquí ya que no contiene anotaciones de verdad fundamental.
Link to this section¿Qué clases de objetos están anotadas en el conjunto de datos?#
kitti incluye anotaciones para objetos como coches, peatones, ciclistas, camiones, tranvías y otros usuarios diversos de la carretera.
Link to this section¿Puedo entrenar modelos Ultralytics YOLO26 usando el conjunto de datos kitti?#
Sí, kitti es totalmente compatible con Ultralytics YOLO26. Puedes entrenar y validar modelos directamente usando el archivo de configuración YAML proporcionado.
Link to this section¿Dónde puedo encontrar el archivo de configuración del conjunto de datos kitti?#
Puedes acceder al archivo YAML en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.