Link to this sectionKITTI Dataset#
kittiデータセットは、自動運転およびコンピュータビジョンにおける最も影響力のあるベンチマークデータセットの1つです。カールスルーエ工科大学とシカゴのトヨタ工業大学によって公開されており、実世界の運転シナリオから収集されたステレオカメラ、LiDAR、およびGPS/IMUデータが含まれています。
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
これは、物体検出、深度推定、オプティカルフロー、およびビジュアルオドメトリのアルゴリズムを評価するために広く使用されています。このデータセットは、2D物体検出タスクにおいてUltralytics YOLO26と完全に互換性があり、トレーニングや評価のためにUltralyticsプラットフォームへ容易に統合できます。
Link to this sectionデータセットの構造#
Kittiのオリジナルのテストセットには正解アノテーションが含まれていないため、ここでは除外されています。
このデータセットには合計7,481枚の画像が含まれており、それぞれに自動車、歩行者、自転車利用者、その他の道路要素などのオブジェクトに関する詳細なアノテーションが付けられています。データセットは主に2つのサブセットに分かれています。
- トレーニングセット: モデルのトレーニングに使用されるアノテーション付きラベルを持つ5,985枚の画像が含まれています。
- 検証セット: パフォーマンス評価およびベンチマークに使用される対応するアノテーションを持つ1,496枚の画像が含まれています。
Link to this sectionアプリケーション#
Kittiデータセットは、以下のようなタスクをサポートし、自動運転やロボティクスの進歩を実現します。
- 自動運転車の認識: 自動運転システムにおける安全なナビゲーションのために、車両、歩行者、障害物を検出し追跡するモデルのトレーニング。
- 3Dシーンの理解: 機械が空間環境を理解するのを助けるために、深度推定、ステレオビジョン、および3D物体位置特定をサポート。
- オプティカルフローと動作予測: オブジェクトの動きを予測し、動的な環境における軌道計画を改善するための動作分析。
- コンピュータビジョンのベンチマーク: 物体検出や追跡を含む複数のビジョンタスク全体のパフォーマンスを評価するための標準ベンチマークとして機能。
Link to this sectionデータセット YAML#
Ultralyticsは、YAMLファイルを使用してkittiデータセットの構成を定義します。このファイルは、トレーニングに必要なデータセットのパス、クラスラベル、およびメタデータを指定します。構成ファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml で入手可能です。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipLink to this section使用方法#
kittiデータセットでYOLO26nモデルを画像サイズ640で100 epochs トレーニングするには、以下のコマンドを使用してください。詳細については、Training ページを参照してください。
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)同じ構成ファイルを使用して、コマンドラインまたはPython APIから直接、評価、inference、および export タスクを実行することもできます。
Link to this sectionサンプル画像とアノテーション#
kittiデータセットは多様な運転シナリオを提供します。各画像には、2D物体検出タスク用のバウンディングボックスのアノテーションが含まれています。これらの例はデータセットの豊かな多様性を示しており、多様な現実世界の状況全体で堅牢なモデルの一般化を可能にします。
Link to this section引用と謝辞#
kittiデータセットを研究で使用する場合は、次の論文を引用してください。
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}コンピュータビジョン、ロボティクス、自動システムの進歩を形作り続けるこの包括的なデータセットを提供してくださったKITTI Vision Benchmark Suiteに感謝いたします。詳細については、kitti website をご覧ください。
Link to this sectionFAQ#
Link to this sectionkittiデータセットは何に使用されますか?#
kittiデータセットは主に自動運転の研究におけるコンピュータビジョンに使用されており、物体検出、深度推定、オプティカルフロー、3D位置特定などのタスクをサポートしています。
Link to this sectionkittiデータセットには何枚の画像が含まれていますか?#
データセットには、都市、地方、高速道路のシーン全体でキャプチャされた5,985枚のラベル付きトレーニング画像と1,496枚の検証画像が含まれています。元のテストセットには正解アノテーションが含まれていないため、ここでは除外されています。
Link to this sectionどのオブジェクトクラスがデータセットでアノテーションされていますか?#
kittiには、自動車、歩行者、自転車利用者、トラック、路面電車、その他の道路利用者などのオブジェクトのアノテーションが含まれています。
Link to this sectionkittiデータセットを使用してUltralytics YOLO26モデルをトレーニングできますか?#
はい、kittiはUltralytics YOLO26と完全に互換性があります。提供されているYAML構成ファイルを使用して、直接モデルを train および validate できます。
Link to this sectionkittiデータセットの構成ファイルはどこにありますか?#
YAMLファイルには https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml からアクセスできます。