KITTIデータセット
kittiデータセットは、自動運転とコンピュータービジョンにおいて最も影響力のあるベンチマークデータセットの一つです。カールスルーエ工科大学とシカゴのトヨタ工科大学によって公開され、実際の運転シナリオから収集されたステレオカメラ、LiDAR、GPS/IMUデータを含んでいます。
見る: KITTIデータセットでUltralytics YOLO26をトレーニングする方法 🚀
これは、物体detect、深度推定、オプティカルフロー、および視覚オドメトリのアルゴリズムを評価するために広く使用されています。このデータセットは、2D物体detectタスク向けのUltralytics YOLO26と完全に互換性があり、トレーニングと評価のためにUltralyticsプラットフォームに簡単に統合できます。
データセットの構造
警告
Kittiのオリジナルテストセットは、グラウンドトゥルースアノテーションが含まれていないため、ここでは除外されています。
合計で、このデータセットには7,481枚の画像が含まれており、それぞれに車、歩行者、自転車利用者、その他の道路要素といった物体に対する詳細なアノテーションが付随しています。データセットは主に2つのサブセットに分けられます。
- トレーニングセット: モデルのトレーニングに使用されるアノテーション付きラベルが付いた5,985枚の画像が含まれています。
- 検証セット: 性能評価とベンチマーキングに使用される、対応するアノテーションが付いた1,496枚の画像が含まれています。
アプリケーション
Kittiデータセットは、自動運転とロボティクスにおける進歩を可能にし、以下のようなタスクをサポートします。
- 自動運転車の知覚: 自動運転システムにおける安全なナビゲーションのために、車両、歩行者、障害物をdetectおよびtrackするモデルをトレーニングします。
- 3Dシーン理解: マシンが空間環境を理解するのを助けるための、深度推定、ステレオビジョン、および3Dオブジェクトのローカリゼーションをサポートします。
- オプティカルフローとモーション予測: モーション分析を可能にし、物体の動きを予測して、動的な環境での軌道計画を改善します。
- コンピュータービジョンベンチマーキング: 物体detectやtrackを含む複数のビジョンタスクにおける性能評価のための標準的なベンチマークとして機能します。
データセット YAML
Ultralyticsは、kittiデータセットの構成をyamlファイルで定義しています。このファイルは、トレーニングに必要なデータセットパス、クラスラベル、およびメタデータを指定します。構成ファイルはhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yamlで入手できます。
ultralytics/cfg/datasets/kitti.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
使用法
画像サイズ640で100 エポックの間kittiデータセットでYOLO26nモデルをトレーニングするには、以下のコマンドを使用します。詳細については、トレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo26n.pt epochs=100 imgsz=640
同じ設定ファイルを使用して、評価、推論、およびエクスポートのタスクをコマンドラインまたはPython APIから直接実行することもできます。
サンプル画像とアノテーション
kittiデータセットは多様な運転シナリオを提供します。各画像には2D物体detectタスク用のバウンディングボックスアノテーションが含まれています。この例は、データセットの豊富な多様性を示しており、多様な実世界条件下での堅牢なモデル汎化を可能にします。

引用と謝辞
研究でkittiデータセットを使用する場合は、以下の論文を引用してください。
引用
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
コンピュータービジョン、ロボティクス、自律システムにおける進歩を形成し続けるこの包括的なデータセットを提供してくれたKITTI Vision Benchmark Suiteに感謝します。詳細については、kittiウェブサイトをご覧ください。
よくある質問
kittiデータセットは何に使用されますか?
kittiデータセットは、主に自動運転におけるコンピュータービジョン研究に利用され、物体detect、深度推定、オプティカルフロー、3Dローカリゼーションなどのタスクをサポートします。
kittiデータセットにはいくつの画像が含まれていますか?
このデータセットには、都市部、農村部、高速道路のシーンで撮影された5,985枚のラベル付きトレーニング画像と1,496枚の検証画像が含まれています。オリジナルテストセットは、グラウンドトゥルースアノテーションが含まれていないため、ここでは除外されています。
データセットにはどのオブジェクトクラスがアノテーションされていますか?
kittiには、車、歩行者、自転車利用者、トラック、路面電車、およびその他の道路利用者といった物体のアノテーションが含まれています。
kittiデータセットを使用してUltralytics YOLO26モデルをトレーニングできますか?
はい、kittiはUltralytics YOLO26と完全に互換性があります。提供されているyaml構成ファイルを使用して、モデルを直接トレーニングおよび検証できます。
kittiデータセットの設定ファイルはどこにありますか?
yamlファイルはhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yamlでアクセスできます。