Jeu de données KITTI
Le jeu de données kitti est l'un des jeux de données de référence les plus influents pour la conduite autonome et la vision par ordinateur. Publié par le Karlsruhe Institute of Technology et le Toyota Technological Institute at Chicago, il contient des données de caméra stéréo, LiDAR et GPS/IMU collectées lors de scénarios de conduite réels.
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
Il est largement utilisé pour évaluer les algorithmes de détection d'objets, d'estimation de profondeur, de flux optique et d'odométrie visuelle. Le jeu de données est entièrement compatible avec Ultralytics YOLO26 pour les tâches de détection d'objets 2D et peut être facilement intégré à la plateforme Ultralytics pour l'entraînement et l'évaluation.
Structure du jeu de données
Le jeu de test original de Kitti est exclu ici car il ne contient pas d'annotations de vérité terrain (ground-truth).
Au total, le jeu de données comprend 7 481 images, chacune accompagnée d'annotations détaillées pour des objets tels que des voitures, des piétons, des cyclistes et d'autres éléments routiers. Le jeu de données est divisé en deux sous-ensembles principaux :
- Ensemble d'entraînement : Contient 5 985 images avec des étiquettes annotées utilisées pour l'entraînement du modèle.
- Ensemble de validation : Inclut 1 496 images avec les annotations correspondantes utilisées pour l'évaluation des performances et l'analyse comparative.
Applications
Le jeu de données Kitti permet des avancées dans la conduite autonome et la robotique, en prenant en charge des tâches comme :
- Perception de véhicule autonome : Entraîner des modèles à détecter et suivre des véhicules, des piétons et des obstacles pour une navigation sûre dans les systèmes de conduite autonome.
- Compréhension de scène 3D : Soutenir l'estimation de la profondeur, la vision stéréo et la localisation d'objets 3D pour aider les machines à comprendre les environnements spatiaux.
- Flux optique et prédiction de mouvement : Permettre l'analyse de mouvement pour prédire le déplacement des objets et améliorer la planification de trajectoire dans des environnements dynamiques.
- Analyse comparative en vision par ordinateur : Servir de référence standard pour évaluer les performances sur de multiples tâches de vision, y compris la détection et le suivi d'objets.
YAML du jeu de données
Ultralytics définit la configuration du jeu de données kitti à l'aide d'un fichier YAML. Ce fichier spécifie les chemins d'accès au jeu de données, les étiquettes de classe et les métadonnées requises pour l'entraînement. Le fichier de configuration est disponible sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipUtilisation
Pour entraîner un modèle YOLO26n sur le jeu de données kitti pendant 100 époques avec une taille d'image de 640, utilise les commandes suivantes. Pour plus de détails, réfère-toi à la page Entraînement.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)Tu peux également effectuer des tâches d'évaluation, d'inférence et d'exportation directement depuis la ligne de commande ou l'API Python en utilisant le même fichier de configuration.
Exemples d'images et d'annotations
Le jeu de données kitti fournit des scénarios de conduite variés. Chaque image inclut des annotations de boîte englobante pour les tâches de détection d'objets 2D. Les exemples démontrent la grande variété du jeu de données, permettant une généralisation robuste du modèle dans diverses conditions réelles.
Citations et remerciements
Si tu utilises le jeu de données kitti dans tes recherches, merci de citer le document suivant :
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}Nous remercions le KITTI Vision Benchmark Suite pour la fourniture de ce jeu de données complet qui continue de façonner les progrès dans la vision par ordinateur, la robotique et les systèmes autonomes. Visite le site web kitti pour plus d'informations.
FAQ
À quoi sert le jeu de données kitti ?
Le jeu de données kitti est principalement utilisé pour la recherche en vision par ordinateur dans la conduite autonome, prenant en charge des tâches telles que la détection d'objets, l'estimation de profondeur, le flux optique et la localisation 3D.
Combien d'images sont incluses dans le jeu de données kitti ?
Le jeu de données inclut 5 985 images d'entraînement étiquetées et 1 496 images de validation capturées dans des scènes urbaines, rurales et autoroutières. Le jeu de test original est exclu ici car il ne contient pas d'annotations de vérité terrain.
Quelles classes d'objets sont annotées dans le jeu de données ?
kitti inclut des annotations pour des objets tels que les voitures, les piétons, les cyclistes, les camions, les tramways et divers usagers de la route.
Puis-je entraîner des modèles Ultralytics YOLO26 en utilisant le jeu de données kitti ?
Oui, kitti est entièrement compatible avec Ultralytics YOLO26. Tu peux entraîner et valider des modèles directement en utilisant le fichier de configuration YAML fourni.
Où puis-je trouver le fichier de configuration du jeu de données kitti ?
Tu peux accéder au fichier YAML sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.