KITTI-Datensatz

Der KITTI-Datensatz ist einer der einflussreichsten Benchmark-Datensätze für autonomes Fahren und Computer Vision. Veröffentlicht vom Karlsruher Institut für Technologie und dem Toyota Technological Institute in Chicago, enthält er Stereokamera-, LiDAR- und GPS/IMU-Daten, die aus realen Fahrszenarien gesammelt wurden.

Ansehen: Wie man Ultralytics YOLO11 auf dem KITTI-Datensatz trainiert 🚀

Es wird häufig zur Bewertung von Algorithmen in der Objekterkennung, Tiefenschätzung, optischen Flussanalyse und visuellen Odometrie eingesetzt. Der Datensatz ist vollständig kompatibel mit Ultralytics YOLO11 für 2D-Objekterkennungsaufgaben und kann einfach in die Ultralytics-Plattform für Training und Evaluierung integriert werden.

Dataset-Struktur

Warnung

Der ursprüngliche Kitti-Testdatensatz ist hier ausgeschlossen, da er keine Ground-Truth-Annotationen enthält.

Insgesamt umfasst der Datensatz 7.481 Bilder, jedes mit detaillierten Anmerkungen für Objekte wie Autos, Fußgänger, Radfahrer und andere Straßenelemente. Der Datensatz ist in zwei Hauptuntergruppen unterteilt:

Trainingssatz: Enthält 5.985 Bilder mit annotierten Labels, die für das Modelltraining verwendet werden.
Validierungsset: Enthält 1.496 Bilder mit entsprechenden Annotationen, die zur Leistungsbewertung und zum Benchmarking verwendet werden.

Anwendungen

Der Kitti-Datensatz ermöglicht Fortschritte im autonomen Fahren und in der Robotik und unterstützt Aufgaben wie:

Wahrnehmung autonomer Fahrzeuge: Modelle trainieren, um Fahrzeuge, Fußgänger und Hindernisse für eine sichere Navigation in selbstfahrenden Systemen zu detect und zu tracken.
3D scene understanding: Unterstützung von Tiefenschätzung, Stereovision und 3D-Objektlokalisierung, um Maschinen beim Verständnis räumlicher Umgebungen zu helfen.
Optischer Fluss und Bewegungsvorhersage: Ermöglicht die Bewegungsanalyse, um die Bewegung von Objekten vorherzusagen und die Trajektorienplanung in dynamischen Umgebungen zu verbessern.
Benchmarking für Computer Vision: Dient als Standard-Benchmark zur Bewertung der Leistung über mehrere Vision-Aufgaben hinweg, einschließlich Objekterkennung (detect) und -verfolgung (track).

Datensatz-YAML

Ultralytics definiert die kitti-Datensatzkonfiguration mithilfe einer YAML-Datei. Diese Datei spezifiziert Datensatzpfade, Klassenbezeichnungen und Metadaten, die für das Training erforderlich sind. Die Konfigurationsdatei ist verfügbar unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.

Ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Nutzung

Um ein YOLO11n-Modell auf dem kitti-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, verwenden Sie die folgenden Befehle. Weitere Details finden Sie auf der Trainingsseite.

Trainingsbeispiel

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

Sie können auch Evaluierungs-, Inference- und Export-Aufgaben direkt über die Befehlszeile oder die python-API unter Verwendung derselben Konfigurationsdatei durchführen.

sample_images und Anmerkungen

Der Kitti-Datensatz bietet vielfältige Fahrszenarien. Jedes Bild enthält Bounding-Box-Annotationen für 2D-Objekterkennungsaufgaben. Das Beispiel demonstriert die reiche Vielfalt des Datensatzes, die eine robuste Modellgeneralisierung unter verschiedenen realen Bedingungen ermöglicht.

Kitti-Beispielbild

Zitate und Danksagungen

Wenn Sie den kitti-Datensatz in Ihrer Forschung verwenden, zitieren Sie bitte das folgende Paper:

Zitat

BibTeX

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Wir würdigen die KITTI Vision Benchmark Suite für die Bereitstellung dieses umfassenden Datensatzes, der den Fortschritt in den Bereichen Computer Vision, Robotik und autonome Systeme weiterhin maßgeblich prägt. Besuchen Sie die KITTI-Website für weitere Informationen.

FAQs

Wofür wird der Kitti-Datensatz verwendet?

Der KITTI-Datensatz wird hauptsächlich für die Computer-Vision-Forschung im autonomen Fahren eingesetzt und unterstützt Aufgaben wie Objekterkennung, Tiefenschätzung, optischen Fluss und 3D-Lokalisierung.

Wie viele Bilder sind im Kitti-Datensatz enthalten?

Der Datensatz umfasst 5.985 annotierte Trainingsbilder und 1.496 Validierungsbilder, die in städtischen, ländlichen und Autobahnszenen aufgenommen wurden. Der ursprüngliche Testsatz ist hier ausgeschlossen, da er keine Ground-Truth-Annotationen enthält.

Welche Objektklassen sind im Datensatz annotiert?

Kitti enthält Annotationen für Objekte wie Autos, Fußgänger, Radfahrer, Lastwagen, Straßenbahnen und verschiedene Verkehrsteilnehmer.

Kann ich Ultralytics YOLO11-Modelle mithilfe des kitti-Datensatzes trainieren?

Ja, kitti ist vollständig kompatibel mit Ultralytics YOLO11. Sie können Modelle direkt mit der mitgelieferten YAML-Konfigurationsdatei trainieren und validieren.

Wo finde ich die Konfigurationsdatei des Kitti-Datensatzes?

Sie können die yaml-Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml abrufen.

📅 Erstellt vor 2 Monaten ✏️ Aktualisiert vor 1 Monat