KITTI 데이터 세트

키티 데이터 세트는 자율주행 및 컴퓨터 비전을 위한 가장 영향력 있는 벤치마크 데이터 세트 중 하나입니다. 칼스루에 공과대학과 시카고 도요타 기술 연구소가 공개한 이 데이터 세트에는 실제 주행 시나리오에서 수집한 스테레오 카메라, LiDAR, GPS/IMU 데이터가 포함되어 있습니다.

참고: KITTI 데이터셋에서 Ultralytics YOLO26 훈련 방법 🚀

객체 detect, 깊이 추정, 광학 흐름 및 시각적 주행 거리 측정 알고리즘 평가에 널리 사용됩니다. 이 데이터셋은 2D 객체 detect 작업에 대해 Ultralytics YOLO26과 완벽하게 호환되며, 훈련 및 평가를 위해 Ultralytics 플랫폼에 쉽게 통합될 수 있습니다.

데이터 세트 구조

경고

Kitti 원본 테스트 세트는 실측 주석을 포함하지 않으므로 여기서 제외합니다.

이 데이터 세트에는 총 7,481개의 이미지가 포함되어 있으며, 각 이미지에는 자동차, 보행자, 자전거 및 기타 도로 요소와 같은 물체에 대한 자세한 주석이 함께 제공됩니다. 데이터 세트는 두 개의 주요 하위 집합으로 나뉩니다:

트레이닝 세트: 모델 학습에 사용되는 주석이 달린 레이블이 있는 5,985개의 이미지가 포함되어 있습니다.
유효성 검사 세트: 성능 평가 및 벤치마킹에 사용되는 1,496개의 이미지와 해당 주석이 포함되어 있습니다.

응용 분야

키티 데이터 세트는 자율 주행 및 로봇 공학 분야의 발전을 가능하게 하여 다음과 같은 작업을 지원합니다:

자율 주행 차량 인지: 자율 주행 시스템에서 안전한 내비게이션을 위해 차량, 보행자 및 장애물을 detect하고 track하도록 모델을 훈련합니다.
3D 장면 이해: 기계가 공간 환경을 이해하도록 돕기 위해 깊이 추정, 스테레오 비전 및 3D 객체 localization을 지원합니다.
광학 흐름 및 모션 예측: 모션 분석을 통해 동적 환경에서 물체의 움직임을 예측하고 궤적 계획을 개선할 수 있습니다.
컴퓨터 비전 벤치마킹: 물체 감지, 추적 등 여러 비전 작업의 성능을 평가하기 위한 표준 벤치마크 역할을 합니다.

데이터세트 YAML

Ultralytics는 YAML 파일을 사용하여 kitti 데이터셋 구성을 정의합니다. 이 파일은 훈련에 필요한 데이터셋 경로, 클래스 레이블 및 메타데이터를 지정합니다. 구성 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 확인할 수 있습니다.

ultralytics/cfg/datasets/kitti.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

사용법

이미지 크기 640으로 kitti 데이터셋에서 100 epoch 동안 YOLO26n 모델을 훈련하려면 다음 명령을 사용하십시오. 자세한 내용은 훈련 페이지를 참조하십시오.

훈련 예제

PythonCLI

from ultralytics import YOLO

# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)

yolo detect train data=kitti.yaml model=yolo26n.pt epochs=100 imgsz=640

또한 동일한 구성 파일을 사용하여 명령줄 또는 Python API에서 직접 평가, 추론 및 내보내기 작업을 수행할 수도 있습니다.

샘플 이미지 및 주석

키티 데이터셋은 다양한 주행 시나리오를 제공합니다. 각 이미지에는 2D 객체 탐지 작업을 위한 경계 상자 주석이 포함되어 있습니다. 예시들은 데이터셋의 풍부한 다양성을 보여주며, 다양한 실제 조건에서 모델의 강력한 일반화 능력을 가능하게 합니다.

KITTI 데이터셋 차량 탐지 샘플

인용 및 감사의 말씀

연구에 키티 데이터셋을 사용하는 경우 다음 논문을 인용해 주세요:

견적

BibTeX

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

컴퓨터 비전, 로봇 공학 및 자율 시스템의 진보를 지속적으로 형성하는 이 포괄적인 데이터 세트를 제공한 KITTI 비전 벤치마크 스위트에 감사드립니다. 자세한 내용은 KITTI 웹사이트를 참조하세요.

자주 묻는 질문

키티 데이터 세트는 어떤 용도로 사용되나요?

키티 데이터 세트는 주로 자율 주행 분야의 컴퓨터 비전 연구에 사용되며 물체 감지, 깊이 추정, 광학 흐름, 3D 현지화와 같은 작업을 지원합니다.

키티 데이터 세트에는 몇 개의 이미지가 포함되나요?

이 데이터 세트에는 도시, 농촌, 고속도로 장면에서 캡처한 5,985개의 레이블이 지정된 훈련 이미지와 1,496개의 검증 이미지가 포함되어 있습니다. 원본 테스트 세트는 실측 주석을 포함하지 않기 때문에 여기서 제외되었습니다.

데이터 세트에 주석이 달린 객체 클래스는 무엇인가요?

키티에는 자동차, 보행자, 자전거, 트럭, 트램, 기타 도로 이용자 등의 객체에 대한 주석이 포함되어 있습니다.

kitti 데이터셋을 사용하여 Ultralytics YOLO26 모델을 훈련할 수 있나요?

예, kitti는 Ultralytics YOLO26과 완벽하게 호환됩니다. 제공된 yaml 구성 파일을 사용하여 모델을 직접 훈련하고 검증할 수 있습니다.

키티 데이터세트 구성 파일은 어디에서 찾을 수 있나요?

YAML 파일은 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml에서 액세스할 수 있습니다.

5; 3 전에 생성됨 ✏️ 17 전에 업데이트됨