KITTI 데이터 세트
키티 데이터 세트는 자율주행 및 컴퓨터 비전을 위한 가장 영향력 있는 벤치마크 데이터 세트 중 하나입니다. 칼스루에 공과대학과 시카고 도요타 기술 연구소가 공개한 이 데이터 세트에는 실제 주행 시나리오에서 수집한 스테레오 카메라, LiDAR, GPS/IMU 데이터가 포함되어 있습니다.
물체 감지, 깊이 추정, 광학 흐름 및 시각적 주행 거리 측정의 알고리즘을 평가하는 데 널리 사용됩니다. 이 데이터 세트는 2D 물체 감지 작업을 위해 Ultralytics YOLO11 완벽하게 호환되며, 훈련 및 평가를 위해 Ultralytics 플랫폼에 쉽게 통합할 수 있습니다.
데이터 세트 구조
경고
Kitti 원본 테스트 세트는 실측 주석을 포함하지 않으므로 여기서 제외합니다.
이 데이터 세트에는 총 7,481개의 이미지가 포함되어 있으며, 각 이미지에는 자동차, 보행자, 자전거 및 기타 도로 요소와 같은 물체에 대한 자세한 주석이 함께 제공됩니다. 데이터 세트는 두 개의 주요 하위 집합으로 나뉩니다:
- 트레이닝 세트: 모델 학습에 사용되는 주석이 달린 레이블이 있는 5,985개의 이미지가 포함되어 있습니다.
- 유효성 검사 세트: 성능 평가 및 벤치마킹에 사용되는 1,496개의 이미지와 해당 주석이 포함되어 있습니다.
응용 분야
키티 데이터 세트는 자율 주행 및 로봇 공학 분야의 발전을 가능하게 하여 다음과 같은 작업을 지원합니다:
- 자율주행 차량 인식: 자율주행 시스템에서 안전한 주행을 위해 차량, 보행자, 장애물을 감지하고 추적하는 훈련 모델입니다.
- 3D 장면 이해: 깊이 추정, 스테레오 비전, 3D 객체 위치 파악을 지원하여 기계가 공간 환경을 이해하는 데 도움을 줍니다.
- 광학 흐름 및 모션 예측: 모션 분석을 통해 동적 환경에서 물체의 움직임을 예측하고 궤적 계획을 개선할 수 있습니다.
- 컴퓨터 비전 벤치마킹: 물체 감지, 추적 등 여러 비전 작업의 성능을 평가하기 위한 표준 벤치마크 역할을 합니다.
데이터세트 YAML
Ultralytics YAML 파일을 사용하여 키티 데이터 세트 구성을 정의합니다. 이 파일은 학습에 필요한 데이터 세트 경로, 클래스 레이블 및 메타데이터를 지정합니다. 구성 파일은 ultralytics 에서 확인할 수 있습니다.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
사용법
이미지 크기가 640인 100개의 에포크에 대한 kitti 데이터 세트에서 YOLO11n 모델을 훈련하려면 다음 명령을 사용합니다. 자세한 내용은 훈련 페이지를 참조하세요.
훈련 예제
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
또한 동일한 구성 파일을 사용하여 명령줄 또는 Python API에서 직접 평가, 추론 및 내보내기 작업을 수행할 수도 있습니다.
샘플 이미지 및 주석
키티 데이터 세트는 다양한 주행 시나리오를 제공합니다. 각 이미지에는 2D 물체 감지 작업을 위한 바운딩 박스 주석이 포함되어 있습니다. 이 예제는 다양한 실제 조건에서 강력한 모델 일반화를 가능하게 하는 데이터 세트의 풍부한 다양성을 보여줍니다.

인용 및 감사의 말씀
연구에 키티 데이터셋을 사용하는 경우 다음 논문을 인용해 주세요:
견적
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
컴퓨터 비전, 로봇 공학 및 자율 시스템의 진보를 지속적으로 형성하는 이 포괄적인 데이터 세트를 제공한 KITTI 비전 벤치마크 스위트에 감사드립니다. 자세한 내용은 KITTI 웹사이트를 참조하세요.
자주 묻는 질문
키티 데이터 세트는 어떤 용도로 사용되나요?
키티 데이터 세트는 주로 자율 주행 분야의 컴퓨터 비전 연구에 사용되며 물체 감지, 깊이 추정, 광학 흐름, 3D 현지화와 같은 작업을 지원합니다.
키티 데이터 세트에는 몇 개의 이미지가 포함되나요?
이 데이터 세트에는 도시, 농촌, 고속도로 장면에서 캡처한 5,985개의 레이블이 지정된 훈련 이미지와 1,496개의 검증 이미지가 포함되어 있습니다. 원본 테스트 세트는 실측 주석을 포함하지 않기 때문에 여기서 제외되었습니다.
데이터 세트에 주석이 달린 객체 클래스는 무엇인가요?
키티에는 자동차, 보행자, 자전거, 트럭, 트램, 기타 도로 이용자 등의 객체에 대한 주석이 포함되어 있습니다.
키티 데이터 세트를 사용하여 Ultralytics YOLO11 모델을 훈련할 수 있나요?
예, kitti는 Ultralytics YOLO11 완벽하게 호환됩니다. 제공된 YAML 구성 파일을 사용하여 직접 모델을 학습하고 검증할 수 있습니다.
키티 데이터세트 구성 파일은 어디에서 찾을 수 있나요?
YAML 파일은 ultralytics 에서 액세스할 수 있습니다.