Dataset KITTI

Apri il Dataset KITTI in Colab

Il dataset kitti è uno dei dataset di riferimento più influenti per la guida autonoma e la computer vision. Rilasciato dal Karlsruhe Institute of Technology e dal Toyota Technological Institute at Chicago, contiene dati stereo camera, LiDAR e GPS/IMU raccolti da scenari di guida nel mondo reale.



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

È ampiamente utilizzato per valutare algoritmi di object detection, stima della profondità, optical flow e odometria visuale. Il dataset è pienamente compatibile con Ultralytics YOLO26 per attività di 2D object detection e può essere facilmente integrato nella piattaforma Ultralytics per l'addestramento e la valutazione.

Struttura del dataset

Avviso

Il test set originale di Kitti è escluso qui poiché non contiene annotazioni ground-truth.

In totale, il dataset include 7.481 immagini, ciascuna accompagnata da annotazioni dettagliate per oggetti come auto, pedoni, ciclisti e altri elementi stradali. Il dataset è suddiviso in due sottoinsiemi principali:

  • Training set: Contiene 5.985 immagini con etichette annotate utilizzate per l'addestramento del modello.
  • Validation set: Include 1.496 immagini con le relative annotazioni utilizzate per la valutazione delle prestazioni e il benchmarking.

Applicazioni

Il dataset Kitti abilita progressi nella guida autonoma e nella robotica, supportando attività come:

  • Percezione dei veicoli autonomi: Addestrare modelli per rilevare e tracciare veicoli, pedoni e ostacoli per una navigazione sicura nei sistemi di guida autonoma.
  • Comprensione della scena 3D: Supportare la stima della profondità, la stereo vision e la localizzazione 3D degli oggetti per aiutare le macchine a comprendere gli ambienti spaziali.
  • Optical flow e previsione del movimento: Abilitare l'analisi del movimento per prevedere lo spostamento degli oggetti e migliorare la pianificazione della traiettoria in ambienti dinamici.
  • Benchmarking di computer vision: Servire come standard di riferimento per valutare le prestazioni su molteplici attività di visione, inclusi l'object detection e il tracking.

YAML del dataset

Ultralytics definisce la configurazione del dataset kitti utilizzando un file YAML. Questo file specifica i percorsi del dataset, le classi delle etichette e i metadati necessari per l'addestramento. Il file di configurazione è disponibile all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Utilizzo

Per addestrare un modello YOLO26n sul dataset kitti per 100 epochs con una dimensione immagine di 640, usa i seguenti comandi. Per ulteriori dettagli, consulta la pagina Training.

Esempio di training
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

Puoi anche eseguire attività di valutazione, inference ed export direttamente dalla riga di comando o dall'API Python utilizzando lo stesso file di configurazione.

Immagini campione e annotazioni

Il dataset kitti fornisce diversi scenari di guida. Ogni immagine include annotazioni bounding box per attività di 2D object detection. Gli esempi mostrano la ricca varietà del dataset, consentendo una robusta generalizzazione del modello in diverse condizioni del mondo reale.

KITTI dataset vehicle detection sample

Citazioni e ringraziamenti

Se utilizzi il dataset kitti nella tua ricerca, cita il seguente articolo:

Citazione
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Riconosciamo la KITTI Vision Benchmark Suite per aver fornito questo dataset completo che continua a plasmare il progresso nella computer vision, nella robotica e nei sistemi autonomi. Visita il sito web di kitti per maggiori informazioni.

FAQ

A cosa serve il dataset kitti?

Il dataset kitti viene utilizzato principalmente per la ricerca sulla computer vision nella guida autonoma, supportando attività come object detection, stima della profondità, optical flow e localizzazione 3D.

Quante immagini sono incluse nel dataset kitti?

Il dataset include 5.985 immagini di addestramento etichettate e 1.496 immagini di validazione catturate in scenari urbani, rurali e autostradali. Il test set originale è escluso qui poiché non contiene annotazioni ground-truth.

Quali classi di oggetti sono annotate nel dataset?

kitti include annotazioni per oggetti come auto, pedoni, ciclisti, camion, tram e vari utenti della strada.

Posso addestrare modelli Ultralytics YOLO26 utilizzando il dataset kitti?

Sì, kitti è pienamente compatibile con Ultralytics YOLO26. Puoi train e validate modelli direttamente utilizzando il file di configurazione YAML fornito.

Dove posso trovare il file di configurazione del dataset kitti?

Puoi accedere al file YAML all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

Commenti