Link to this sectionDataset KITTI#
O dataset kitti é um dos datasets de referência mais influentes para condução autónoma e visão computacional. Lançado pelo Karlsruhe Institute of Technology e pelo Toyota Technological Institute at Chicago, contém dados de câmara estéreo, LiDAR e GPS/IMU recolhidos a partir de cenários de condução do mundo real.
Watch: How to Train Ultralytics YOLO26 on the KITTI Dataset 🚀
É amplamente utilizado para avaliar algoritmos em deteção de objetos, estimativa de profundidade, fluxo ótico e odometria visual. O dataset é totalmente compatível com o Ultralytics YOLO26 para tarefas de deteção de objetos 2D e pode ser facilmente integrado na plataforma Ultralytics para treino e avaliação.
Link to this sectionEstrutura do Dataset#
O conjunto de teste original do kitti foi excluído aqui, uma vez que não contém anotações de ground-truth.
No total, o dataset inclui 7.481 imagens, cada uma emparelhada com anotações detalhadas para objetos como carros, peões, ciclistas e outros elementos rodoviários. O dataset está dividido em dois subconjuntos principais:
- Conjunto de treino: Contém 5.985 imagens com etiquetas anotadas utilizadas para o treino de modelos.
- Conjunto de validação: Inclui 1.496 imagens com as correspondentes anotações, utilizadas para a avaliação de desempenho e benchmarking.
Link to this sectionAplicações#
O dataset kitti permite avanços na condução autónoma e robótica, suportando tarefas como:
- Perceção de veículos autónomos: Treinar modelos para detetar e seguir veículos, peões e obstáculos para uma navegação segura em sistemas de condução autónoma.
- Compreensão de cenas 3D: Suportar estimativa de profundidade, visão estéreo e localização de objetos 3D para ajudar as máquinas a compreender ambientes espaciais.
- Fluxo ótico e previsão de movimento: Permitir a análise de movimento para prever a deslocação de objetos e melhorar o planeamento de trajetórias em ambientes dinâmicos.
- Benchmarking de visão computacional: Servir como um benchmark padrão para avaliar o desempenho em múltiplas tarefas de visão, incluindo deteção e seguimento de objetos.
Link to this sectionYAML do Dataset#
O Ultralytics define a configuração do dataset kitti utilizando um ficheiro YAML. Este ficheiro especifica os caminhos do dataset, etiquetas de classe e metadados necessários para o treino. O ficheiro de configuração está disponível em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# KITTI dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
# └── kitti ← downloads here (390.5 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images
names:
0: car
1: van
2: truck
3: pedestrian
4: person_sitting
5: cyclist
6: tram
7: misc
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zipLink to this sectionUso#
Para treinar um modelo YOLO26n no dataset kitti durante 100 epochs com um tamanho de imagem de 640, utiliza os seguintes comandos. Para mais detalhes, consulta a página de Treino.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)Também podes realizar tarefas de avaliação, inferência e exportação diretamente a partir da linha de comandos ou da API Python, utilizando o mesmo ficheiro de configuração.
Link to this sectionExemplos de Imagens e Anotações#
O dataset kitti fornece diversos cenários de condução. Cada imagem inclui anotações de bounding box para tarefas de deteção de objetos 2D. Os exemplos demonstram a grande variedade do dataset, permitindo uma generalização robusta do modelo em diversas condições do mundo real.
Link to this sectionCitações e Agradecimentos#
Se utilizares o dataset kitti na tua investigação, por favor cita o seguinte artigo:
@article{Geiger2013IJRR,
author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
title = {Vision meets Robotics: The KITTI Dataset},
journal = {International Journal of Robotics Research (IJRR)},
year = {2013}
}Agradecemos ao KITTI Vision Benchmark Suite por fornecer este dataset abrangente que continua a moldar o progresso na visão computacional, robótica e sistemas autónomos. Visita o website do kitti para mais informações.
Link to this sectionFAQs#
Link to this sectionPara que é utilizado o dataset kitti?#
O dataset kitti é utilizado principalmente para investigação em visão computacional na condução autónoma, suportando tarefas como deteção de objetos, estimativa de profundidade, fluxo ótico e localização 3D.
Link to this sectionQuantas imagens estão incluídas no dataset kitti?#
O dataset inclui 5.985 imagens de treino rotuladas e 1.496 imagens de validação captadas em cenários urbanos, rurais e autoestradas. O conjunto de teste original foi excluído aqui, uma vez que não contém anotações de ground-truth.
Link to this sectionQue classes de objetos estão anotadas no dataset?#
O kitti inclui anotações para objetos como carros, peões, ciclistas, camiões, elétricos e outros utilizadores da via pública.
Link to this sectionPosso treinar modelos Ultralytics YOLO26 usando o dataset kitti?#
Sim, o kitti é totalmente compatível com o Ultralytics YOLO26. Podes treinar e validar modelos diretamente utilizando o ficheiro de configuração YAML fornecido.
Link to this sectionOnde posso encontrar o ficheiro de configuração do dataset kitti?#
Podes aceder ao ficheiro YAML em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/kitti.yaml.