Skip to main content

KITTI 데이터셋

Colab에서 KITTI 데이터셋 열기

KITTI 데이터셋은 자율 주행 및 컴퓨터 비전 분야에서 가장 영향력 있는 벤치마크 데이터셋 중 하나입니다. 칼스루에 공과대학교(Karlsruhe Institute of Technology)와 시카고 도요타 기술 연구소(Toyota Technological Institute at Chicago)에서 공개한 이 데이터셋은 실제 주행 시나리오에서 수집한 스테레오 카메라, LiDAR, GPS/IMU 데이터를 포함합니다.



시청하기: KITTI 데이터셋으로 Ultralytics YOLO26 학습하는 방법 🚀

이 데이터셋은 객체 감지, 깊이 추정, 광학 흐름, 시각적 주행 거리 측정 알고리즘 평가에 널리 사용됩니다. Ultralytics YOLO26과 2D 객체 감지 작업에 완전히 호환되며 학습 및 평가를 위한 Ultralytics 플랫폼에 쉽게 통합할 수 있습니다.

데이터셋 구조

Warning

KITTI 원본 테스트 세트는 정답 주석이 포함되어 있지 않으므로 여기서 제외됩니다.

데이터셋은 총 7,481개의 이미지로 구성되어 있으며, 각 이미지에는 자동차, 보행자, 자전거 이용자 및 기타 도로 요소에 대한 상세한 주석이 포함되어 있습니다. 데이터셋은 두 가지 주요 하위 집합으로 나뉩니다.

  • 학습 세트: 모델 학습에 사용되는 주석이 달린 레이블이 있는 5,985개의 이미지를 포함합니다.
  • 검증 세트: 성능 평가 및 벤치마킹에 사용되는 해당 주석이 있는 1,496개의 이미지를 포함합니다.

활용 분야

KITTI 데이터셋은 자율 주행 및 로보틱스 발전을 가능하게 하며 다음과 같은 작업을 지원합니다.

  • 자율 주행 차량 인식: 자율 주행 시스템에서 안전한 항법을 위해 차량, 보행자 및 장애물을 감지하고 추적하는 모델 학습.
  • 3D 장면 이해: 기계가 공간 환경을 이해할 수 있도록 깊이 추정, 스테레오 비전 및 3D 객체 위치 파악 지원.
  • 광학 흐름 및 동작 예측: 동적 환경에서 객체의 움직임을 예측하고 궤적 계획을 개선하기 위한 동작 분석 지원.
  • 컴퓨터 비전 벤치마킹: 객체 감지 및 추적을 포함한 다양한 비전 작업의 성능을 평가하는 표준 벤치마크 역할.

데이터셋 YAML

Ultralytics는 YAML 파일을 사용하여 KITTI 데이터셋 설정을 정의합니다. 이 파일은 학습에 필요한 데이터셋 경로, 클래스 레이블 및 메타데이터를 지정합니다. 설정 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 확인할 수 있습니다.

ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

사용법

KITTI 데이터셋으로 이미지 크기 640으로 100 에포크 동안 YOLO26n 모델을 학습하려면 다음 명령을 사용하세요. 자세한 내용은 학습 페이지를 참고하세요.

학습 예시
from ultralytics import YOLO

# 사전 학습된 YOLO26 모델 불러오기
model = YOLO("yolo26n.pt")

# kitti 데이터셋으로 학습
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

동일한 설정 파일을 사용하여 커맨드 라인 또는 Python API에서 직접 평가, 추론내보내기 작업도 수행할 수 있습니다.

샘플 이미지 및 주석

KITTI 데이터셋은 다양한 주행 시나리오를 제공합니다. 각 이미지에는 2D 객체 감지 작업을 위한 바운딩 박스 주석이 포함되어 있습니다. 예시들은 데이터셋의 풍부한 다양성을 보여주며, 다양한 실제 환경에서 강건한 모델 일반화를 가능하게 합니다.

KITTI 데이터셋 차량 감지 샘플

인용 및 감사의 말

연구에 KITTI 데이터셋을 사용하는 경우 다음 논문을 인용해 주세요.

Quote
@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

컴퓨터 비전, 로보틱스 및 자율 시스템의 발전을 지속적으로 이끌고 있는 이 종합적인 데이터셋을 제공한 KITTI Vision Benchmark Suite에 감사드립니다. 자세한 내용은 KITTI 웹사이트를 방문하세요.

자주 묻는 질문

KITTI 데이터셋은 무엇에 사용됩니까?

KITTI 데이터셋은 주로 자율 주행 분야의 컴퓨터 비전 연구에 사용되며, 객체 감지, 깊이 추정, 광학 흐름 및 3D 위치 파악 등의 작업을 지원합니다.

KITTI 데이터셋에는 이미지가 몇 개 포함되어 있습니까?

데이터셋에는 도시, 농촌 및 고속도로 장면에서 수집된 5,985개의 레이블이 있는 학습 이미지와 1,496개의 검증 이미지가 포함되어 있습니다. 원본 테스트 세트는 정답 주석이 포함되어 있지 않으므로 여기서 제외됩니다.

데이터셋에는 어떤 객체 클래스가 주석 처리되어 있습니까?

KITTI에는 자동차, 보행자, 자전거 이용자, 트럭, 전차 및 기타 도로 이용자와 같은 객체에 대한 주석이 포함되어 있습니다.

KITTI 데이터셋을 사용하여 Ultralytics YOLO26 모델을 학습할 수 있습니까?

네, KITTI는 Ultralytics YOLO26과 완전히 호환됩니다. 제공된 YAML 설정 파일을 사용하여 직접 모델을 학습하고 검증할 수 있습니다.

KITTI 데이터셋 설정 파일은 어디에서 찾을 수 있습니까?

YAML 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 확인할 수 있습니다.

댓글