KITTI 데이터셋

Open KITTI Dataset In Colab

kitti 데이터셋은 자율 주행 및 컴퓨터 비전을 위한 가장 영향력 있는 벤치마크 데이터셋 중 하나입니다. 카를스루에 공과대학교(Karlsruhe Institute of Technology)와 시카고 도요타 기술 연구소(Toyota Technological Institute at Chicago)에서 발표하였으며, 실제 주행 시나리오에서 수집된 스테레오 카메라, LiDAR 및 GPS/IMU 데이터를 포함하고 있습니다.



Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀

이 데이터셋은 객체 탐지, 깊이 추정, 광학 흐름 및 시각적 주행 거리 측정 분야의 알고리즘을 평가하는 데 널리 사용됩니다. 이 데이터셋은 2D 객체 탐지 작업을 위해 Ultralytics YOLO26과 완벽하게 호환되며, 학습 및 평가를 위해 Ultralytics 플랫폼에 쉽게 통합될 수 있습니다.

데이터셋 구조

경고

Kitti 원본 테스트 세트에는 정답 레이블(ground-truth annotation)이 포함되어 있지 않으므로 여기에서는 제외되었습니다.

이 데이터셋에는 총 7,481장의 이미지가 포함되어 있으며, 각 이미지에는 자동차, 보행자, 자전거 이용자 및 기타 도로 요소와 같은 객체에 대한 상세한 주석이 달려 있습니다. 데이터셋은 두 개의 주요 하위 집합으로 나뉩니다:

  • 학습 세트: 모델 학습에 사용되는 주석 처리된 레이블이 포함된 5,985장의 이미지.
  • 검증 세트: 성능 평가 및 벤치마킹에 사용되는 해당 주석이 포함된 1,496장의 이미지.

응용 분야

Kitti 데이터셋은 다음과 같은 작업을 지원하여 자율 주행 및 로봇 공학의 발전을 가능하게 합니다:

  • 자율 주행 차량 인식: 자율 주행 시스템의 안전한 주행을 위해 차량, 보행자 및 장애물을 탐지하고 추적하도록 모델을 학습시킵니다.
  • 3D 장면 이해: 기계가 공간 환경을 이해하도록 돕기 위해 깊이 추정, 스테레오 비전 및 3D 객체 위치 파악을 지원합니다.
  • 광학 흐름 및 동작 예측: 객체의 움직임을 예측하고 동적 환경에서 궤적 계획을 개선하기 위한 동작 분석을 가능하게 합니다.
  • 컴퓨터 비전 벤치마킹: 객체 탐지 및 추적을 포함한 다양한 비전 작업 전반에 걸쳐 성능을 평가하기 위한 표준 벤치마크 역할을 합니다.

데이터셋 YAML

Ultralytics는 YAML 파일을 사용하여 kitti 데이터셋 구성을 정의합니다. 이 파일은 학습에 필요한 데이터셋 경로, 클래스 레이블 및 메타데이터를 지정합니다. 구성 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 확인할 수 있습니다.

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

사용법

kitti 데이터셋에서 이미지 크기 640으로 100 epochs 동안 YOLO26n 모델을 학습하려면 다음 명령어를 사용하십시오. 자세한 내용은 학습(Training) 페이지를 참조하십시오.

학습 예제
from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

동일한 구성 파일을 사용하여 명령줄 또는 Python API에서 직접 평가, 추론(inference)내보내기(export) 작업을 수행할 수도 있습니다.

샘플 이미지 및 주석

kitti 데이터셋은 다양한 주행 시나리오를 제공합니다. 각 이미지에는 2D 객체 탐지 작업을 위한 바운딩 박스 주석이 포함되어 있습니다. 예제들은 데이터셋의 풍부한 다양성을 보여주며, 다양한 실제 조건에서 모델의 강력한 일반화 능력을 구현할 수 있게 합니다.

KITTI dataset vehicle detection sample

인용 및 감사의 글

연구에 kitti 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

컴퓨터 비전, 로봇 공학 및 자율 주행 시스템 분야에서 지속적으로 발전을 이끌고 있는 이 포괄적인 데이터셋을 제공해 준 KITTI Vision Benchmark Suite에 감사를 표합니다. 자세한 내용은 kitti 웹사이트를 방문하십시오.

자주 묻는 질문(FAQ)

kitti 데이터셋은 무엇을 위해 사용됩니까?

kitti 데이터셋은 주로 자율 주행 분야의 컴퓨터 비전 연구에 사용되며, 객체 탐지, 깊이 추정, 광학 흐름 및 3D 위치 파악과 같은 작업을 지원합니다.

kitti 데이터셋에는 몇 개의 이미지가 포함되어 있습니까?

이 데이터셋에는 도시, 농촌 및 고속도로 장면 전반에 걸쳐 촬영된 5,985장의 레이블이 지정된 학습 이미지와 1,496장의 검증 이미지가 포함되어 있습니다. 원본 테스트 세트에는 정답 레이블이 포함되어 있지 않으므로 여기에서는 제외되었습니다.

데이터셋에는 어떤 객체 클래스가 주석 처리되어 있습니까?

kitti에는 자동차, 보행자, 자전거 이용자, 트럭, 전차 및 기타 다양한 도로 사용자와 같은 객체에 대한 주석이 포함되어 있습니다.

kitti 데이터셋을 사용하여 Ultralytics YOLO26 모델을 학습할 수 있습니까?

네, kitti는 Ultralytics YOLO26과 완벽하게 호환됩니다. 제공된 YAML 구성 파일을 사용하여 모델을 직접 학습(train)하고 검증(validate)할 수 있습니다.

kitti 데이터셋 구성 파일은 어디에서 찾을 수 있습니까?

https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 YAML 파일에 액세스할 수 있습니다.

댓글