KITTI データセット
kitti データセットは、自動運転やコンピュータビジョンにおいて最も影響力のあるベンチマークデータセットの一つです。カールスルーエ工科大学とシカゴのトヨタ工業大学によって公開されたこのデータセットには、実際の走行シナリオから収集されたステレオカメラ、LiDAR、および GPS/IMU データが含まれています。
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
これは、物体検出、深度推定、オプティカルフロー、および視覚的オドメトリのアルゴリズムを評価するために広く使用されています。このデータセットは 2D 物体検出タスク向けに Ultralytics YOLO26 と完全な互換性があり、学習や評価のために Ultralytics プラットフォームに簡単に統合できます。
データセットの構造
Kitti のオリジナルテストセットには正解アノテーションが含まれていないため、ここでは除外されています。
このデータセットには合計 7,481 枚の画像が含まれており、それぞれに車、歩行者、自転車利用者、その他の道路上の要素に関する詳細なアノテーションが付けられています。データセットは主に 2 つのサブセットに分かれています。
- トレーニングセット: モデルの学習に使用されるアノテーション付きラベルを備えた 5,985 枚の画像が含まれています。
- 検証セット: パフォーマンス評価やベンチマークに使用される、対応するアノテーションを備えた 1,496 枚の画像が含まれています。
アプリケーション
Kitti データセットは、以下のようなタスクをサポートし、自動運転やロボット工学の進歩を可能にします。
- 自動運転車の認識: 自動運転システムにおける安全なナビゲーションのために、車両、歩行者、障害物を検出・追跡するモデルを学習させます。
- 3D シーン理解: マシンが空間環境を理解できるように、深度推定、ステレオビジョン、および 3D 物体位置特定をサポートします。
- オプティカルフローと動作予測: 動作解析を可能にし、動的環境における物体の動きを予測し、軌道計画を改善します。
- コンピュータビジョンのベンチマーク: 物体検出や追跡を含む複数のビジョンタスク全体のパフォーマンスを評価するための標準的なベンチマークとして機能します。
データセットYAML
Ultralytics は、YAML ファイルを使用して kitti データセットの構成を定義します。このファイルは、学習に必要なデータセットパス、クラスラベル、メタデータを指定します。構成ファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml で入手可能です。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip使用方法
kitti データセットで YOLO26n モデルを画像サイズ 640 で 100 epochs 分学習させるには、次のコマンドを使用します。詳細については、トレーニング ページを参照してください。
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)同じ構成ファイルを使用して、コマンドラインや Python API から直接、評価、推論、およびエクスポートタスクを実行することもできます。
サンプル画像とアノテーション
kitti データセットは多様な走行シナリオを提供します。各画像には、2D 物体検出タスク用のバウンディングボックスアノテーションが含まれています。これらの例は、データセットの豊富な多様性を示しており、さまざまな現実世界の条件下で堅牢なモデルの汎化を可能にします。
引用と謝辞
研究で kitti データセットを使用する場合は、次の論文を引用してください。
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}コンピュータビジョン、ロボット工学、自動システムの進歩を形作り続けているこの包括的なデータセットを提供してくださった KITTI Vision Benchmark Suite に感謝いたします。詳細については、kitti ウェブサイトをご覧ください。
よくある質問 (FAQ)
kitti データセットは何に使用されますか?
kitti データセットは主に自動運転におけるコンピュータビジョン研究に使用され、物体検出、深度推定、オプティカルフロー、3D 位置特定などのタスクをサポートしています。
kitti データセットには何枚の画像が含まれていますか?
このデータセットには、都市部、地方、高速道路のシーンにわたって撮影された 5,985 枚のラベル付き学習画像と 1,496 枚の検証画像が含まれています。オリジナルのテストセットには正解アノテーションが含まれていないため、ここでは除外されています。
データセットにはどのオブジェクトクラスがアノテーションされていますか?
kitti には、車、歩行者、自転車利用者、トラック、路面電車、その他さまざまな道路利用者のアノテーションが含まれています。
kitti データセットを使用して Ultralytics YOLO26 モデルを学習できますか?
はい、kitti は Ultralytics YOLO26 と完全な互換性があります。提供された YAML 構成ファイルを使用して、直接モデルの 学習 と 検証 を行うことができます。
kitti データセットの構成ファイルはどこで入手できますか?
https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml から YAML ファイルにアクセスできます。