Passer au contenu

Ensemble de données KITTI

L'ensemble de données kitti est l'un des ensembles de données de référence les plus influents pour la conduite autonome et la vision par ordinateur. Publié par le Karlsruhe Institute of Technology et le Toyota Technological Institute de Chicago, il contient des données de caméras stéréo, de LiDAR et de GPS/IMU collectées dans le cadre de scénarios de conduite réels.

Il est largement utilisé pour évaluer les algorithmes de détection d'objets, d'estimation de la profondeur, de flux optique et d'odométrie visuelle. Le jeu de données est entièrement compatible avec Ultralytics YOLO11 pour les tâches de détection d'objets en 2D et peut être facilement intégré dans la plateforme Ultralytics pour la formation et l'évaluation.

Structure du jeu de données

Avertissement

L'ensemble de test original de Kitti est exclu ici car il ne contient pas d'annotations véridiques.

Au total, l'ensemble de données comprend 7 481 images, chacune associée à des annotations détaillées d'objets tels que des voitures, des piétons, des cyclistes et d'autres éléments de la route. L'ensemble de données est divisé en deux sous-ensembles principaux :

  • Ensemble d'entraînement : Contient 5 985 images avec des étiquettes annotées utilisées pour l'apprentissage du modèle.
  • Ensemble de validation : Comprend 1 496 images avec les annotations correspondantes utilisées pour l'évaluation des performances et l'étalonnage.

Applications

L'ensemble de données Kitti permet des avancées dans les domaines de la conduite autonome et de la robotique, en prenant en charge des tâches telles que.. :

  • Perception des véhicules autonomes: Formation de modèles pour détecter et suivre les véhicules, les piétons et les obstacles pour une navigation sûre dans les systèmes de conduite autonome.
  • Compréhension des scènes en 3D: Prise en charge de l'estimation de la profondeur, de la vision stéréo et de la localisation d'objets en 3D pour aider les machines à comprendre les environnements spatiaux.
  • Débit optique et prédiction de mouvement: Permettre l'analyse du mouvement pour prédire le mouvement des objets et améliorer la planification de la trajectoire dans des environnements dynamiques.
  • Évaluation comparative de la vision par ordinateur: Servir de référence standard pour évaluer les performances dans de multiples tâches de vision, y compris la détection et le suivi d'objets.

YAML du jeu de données

Ultralytics définit la configuration du jeu de données kitti à l'aide d'un fichier YAML. Ce fichier spécifie les chemins d'accès au jeu de données, les étiquettes de classe et les métadonnées nécessaires à la formation. Le fichier de configuration est disponible à l'ultralytics

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Utilisation

Pour entraîner un modèle YOLO11n sur l'ensemble de données kitti pour 100 époques avec une taille d'image de 640, utilisez les commandes suivantes. Pour plus de détails, reportez-vous à la page Entraînement.

Exemple d'entraînement

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

Vous pouvez également effectuer des tâches d'évaluation, d'inférence et d'exportation directement à partir de la ligne de commande ou de l'API Python en utilisant le même fichier de configuration.

Images et annotations d'exemple

L'ensemble de données kitti présente divers scénarios de conduite. Chaque image comprend des annotations de boîtes de délimitation pour les tâches de détection d'objets en 2D. L'exemple montre la grande variété de l'ensemble de données, permettant une généralisation robuste du modèle dans diverses conditions du monde réel.

Kitti exemple d'image

Citations et remerciements

Si vous utilisez l'ensemble de données Kitti dans votre recherche, veuillez citer l'article suivant :

Citation

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Nous remercions la KITTI Vision Benchmark Suite d'avoir fourni cet ensemble de données complet qui continue à façonner les progrès dans les domaines de la vision par ordinateur, de la robotique et des systèmes autonomes. Visitez le site web kitti pour plus d'informations.

FAQ

À quoi sert l'ensemble de données Kitti ?

L'ensemble de données kitti est principalement utilisé pour la recherche en vision artificielle dans le domaine de la conduite autonome. Il prend en charge des tâches telles que la détection d'objets, l'estimation de la profondeur, le flux optique et la localisation en 3D.

Combien d'images sont incluses dans l'ensemble de données kitti ?

L'ensemble de données comprend 5 985 images d'apprentissage étiquetées et 1 496 images de validation capturées dans des scènes urbaines, rurales et autoroutières. L'ensemble de test original est exclu ici car il ne contient pas d'annotations de vérité sur le terrain.

Quelles sont les classes d'objets annotées dans l'ensemble de données ?

kitti comprend des annotations pour des objets tels que des voitures, des piétons, des cyclistes, des camions, des tramways et divers usagers de la route.

Puis-je entraîner les modèlesYOLO11 d'Ultralytics en utilisant le jeu de données Kitti ?

Oui, kitti est entièrement compatible avec Ultralytics YOLO11. Vous pouvez entraîner et valider les modèles directement en utilisant le fichier de configuration YAML fourni.

Où puis-je trouver le fichier de configuration du jeu de données kitti ?

Vous pouvez accéder au fichier YAML à l'adresse suivante ultralytics.



📅 Créé il y a 0 jour ✏️ Mis à jour il y a 0 jour

Commentaires