KITTI データセット
kittiデータセットは、自律走行とコンピュータビジョンのための最も影響力のあるベンチマークデータセットの1つである。カールスルーエ工科大学とシカゴ豊田工業大学によって公開されたこのデータセットには、実走行シナリオから収集されたステレオカメラ、LiDAR、GPS/IMUデータが含まれている。
このデータセットは、物体検出、深度推定、オプティカルフロー、視覚オドメトリのアルゴリズムの評価に広く使用されています。このデータセットは、2D物体検出タスク用のUltralytics YOLO11 完全に互換性があり、トレーニングと評価のためにUltralytics プラットフォームに簡単に統合できます。
データセットの構造
警告
Kittiオリジナルのテストセットは、グランド・トゥルースのアノテーションが含まれていないため、ここでは除外している。
データセットには合計で7,481枚の画像が含まれ、それぞれに自動車、歩行者、自転車、その他の道路要素などのオブジェクトに対する詳細なアノテーションが対になっている。データセットは主に2つのサブセットに分かれている:
- トレーニングセット:モデルのトレーニングに使用される注釈付きラベルを持つ5,985枚の画像を含む。
- 検証セット:性能評価とベンチマークに使用される、対応する注釈付きの1,496枚の画像を含む。
アプリケーション
Kittiデータセットは、自律走行とロボット工学の進歩を可能にし、次のようなタスクをサポートする:
- 自律走行車の知覚:自動運転システムにおける安全なナビゲーションのために、車両、歩行者、障害物を検知・追跡するモデルをトレーニングする。
- 3Dシーン理解:深度推定、ステレオビジョン、3Dオブジェクトのローカリゼーションをサポートし、機械が空間環境を理解するのを助ける。
- オプティカルフローと運動予測:動的環境における物体の動きを予測し、軌道計画を改善するための動作分析を可能にする。
- コンピュータビジョンのベンチマーク:物体検出やトラッキングなど、複数の視覚タスクのパフォーマンスを評価するための標準ベンチマークとして機能する。
データセット YAML
Ultralytics YAMLファイルを使用してkittiデータセットの設定を定義します。このファイルはデータセットのパス、クラスラベル、トレーニングに必要なメタデータを指定する。設定ファイルはultralytics
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip
使用法
kittiデータセットでYOLO11nモデルを画像サイズ640で100エポック学習させるには、以下のコマンドを使用する。詳細はトレーニングのページを参照してください。
学習の例
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640
同じ設定ファイルを使って、コマンドラインやPython APIから直接、評価、推論、エクスポートのタスクを実行することもできる。
サンプル画像とアノテーション
kittiデータセットは多様な運転シナリオを提供する。各画像には、2次元物体検出タスクのためのバウンディングボックス注釈が含まれている。この例では、データセットの豊富なバリエーションを紹介し、多様な実世界の条件にわたってロバストなモデルの一般化を可能にする。

引用と謝辞
kittiデータセットを研究に使用する場合は、以下の論文を引用してください:
引用
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}
KITTI Vision Benchmark Suiteは、コンピュータビジョン、ロボット工学、自律システムの進歩を形成し続けるこの包括的なデータセットを提供してくれている。詳しくはkittiのウェブサイトをご覧ください。
よくあるご質問
kittiデータセットは何に使われているのですか?
kittiデータセットは、主に自律走行におけるコンピュータビジョンの研究に使用されており、物体検出、深度推定、オプティカルフロー、3Dローカライゼーションなどのタスクをサポートしている。
kittiデータセットには何枚の画像が含まれていますか?
データセットには、5,985枚のラベル付きトレーニング画像と、都市部、農村部、高速道路の各シーンで撮影された1,496枚の検証画像が含まれる。オリジナルのテストセットは、グラウンド・トゥルースのアノテーションが含まれていないため、ここでは除外している。
どのオブジェクトクラスがデータセットにアノテーションされているか?
kittiには、自動車、歩行者、自転車、トラック、路面電車、雑多な道路利用者といったオブジェクトの注釈が含まれている。
kittiデータセットを使ってUltralytics YOLO11 モデルをトレーニングできますか?
はい、kittiはUltralytics YOLO11完全に互換性があります。提供されているYAML設定ファイルを使用して、モデルを直接トレーニングおよび検証できます。
kittiデータセットの設定ファイルはどこにありますか?
YAMLファイルはultralytics