Ir para o conteúdo

Conjunto de dados KITTI

O conjunto de dados kitti é um dos mais influentes conjuntos de dados de referência para a condução autónoma e a visão computacional. Lançado pelo Instituto de Tecnologia de Karlsruhe e pelo Instituto Tecnológico da Toyota em Chicago, contém dados de câmaras estéreo, LiDAR e GPS/IMU recolhidos em cenários de condução reais.

É amplamente utilizado para avaliar algoritmos de deteção de objectos, estimativa de profundidade, fluxo ótico e odometria visual. O conjunto de dados é totalmente compatível com o Ultralytics YOLO11 para tarefas de deteção de objectos 2D e pode ser facilmente integrado na plataforma Ultralytics para formação e avaliação.

Estrutura do Conjunto de Dados

Aviso

O conjunto de teste original do Kitti é excluído aqui, uma vez que não contém anotações de verdade.

No total, o conjunto de dados inclui 7.481 imagens, cada uma delas emparelhada com anotações detalhadas de objectos como carros, peões, ciclistas e outros elementos da estrada. O conjunto de dados está dividido em dois subconjuntos principais:

  • Conjunto de treino: Contém 5.985 imagens com etiquetas anotadas utilizadas para o treino do modelo.
  • Conjunto de validação: Inclui 1.496 imagens com anotações correspondentes utilizadas para avaliação do desempenho e benchmarking.

Aplicações

O conjunto de dados Kitti permite avanços na condução autónoma e na robótica, apoiando tarefas como:

  • Perceção de veículos autónomos: Modelos de treino para detetar e seguir veículos, peões e obstáculos para uma navegação segura em sistemas de condução autónoma.
  • Compreensão de cenas 3D: Apoio à estimativa de profundidade, visão estéreo e localização de objectos 3D para ajudar as máquinas a compreender ambientes espaciais.
  • Fluxo ótico e previsão de movimento: Possibilitar a análise de movimento para prever o movimento de objectos e melhorar o planeamento de trajectórias em ambientes dinâmicos.
  • Avaliação comparativa da visão por computador: Servir como padrão de referência para avaliar o desempenho em múltiplas tarefas de visão, incluindo deteção e seguimento de objectos.

YAML do Conjunto de Dados

Ultralytics define a configuração do conjunto de dados kitti utilizando um ficheiro YAML. Este ficheiro especifica os caminhos do conjunto de dados, as etiquetas das classes e os metadados necessários para a formação. O ficheiro de configuração está disponível em ultralytics

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Utilização

Para treinar um modelo YOLO11n no conjunto de dados kitti para 100 épocas com um tamanho de imagem de 640, utilize os seguintes comandos. Para obter mais detalhes, consulte a página Treinamento.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

Também é possível executar tarefas de avaliação, inferência e exportação diretamente a partir da linha de comandos ou da API Python utilizando o mesmo ficheiro de configuração.

Amostras de Imagens e Anotações

O conjunto de dados kitti apresenta diversos cenários de condução. Cada imagem inclui anotações de caixas delimitadoras para tarefas de deteção de objectos 2D. O exemplo mostra a rica variedade do conjunto de dados, permitindo uma generalização robusta do modelo em diversas condições do mundo real.

Imagem de amostra de Kitti

Citações e Agradecimentos

Se utilizar o conjunto de dados kitti na sua investigação, cite o seguinte documento:

Citação

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Agradecemos ao KITTI Vision Benchmark Suite por fornecer este conjunto de dados abrangente que continua a moldar o progresso na visão computacional, robótica e sistemas autónomos. Visite o site do kitti para obter mais informações.

Perguntas frequentes

Para que é utilizado o conjunto de dados kitti?

O conjunto de dados kitti é utilizado principalmente para a investigação da visão computacional na condução autónoma, apoiando tarefas como a deteção de objectos, a estimativa da profundidade, o fluxo ótico e a localização 3D.

Quantas imagens estão incluídas no conjunto de dados kitti?

O conjunto de dados inclui 5.985 imagens de treino rotuladas e 1.496 imagens de validação capturadas em cenários urbanos, rurais e de autoestrada. O conjunto de teste original é excluído aqui, uma vez que não contém anotações de verdade.

Que classes de objectos são anotadas no conjunto de dados?

O kitti inclui anotações para objectos como carros, peões, ciclistas, camiões, eléctricos e outros utentes da estrada.

Posso treinar modelos Ultralytics YOLO11 utilizando o conjunto de dados kitti?

Sim, o kitti é totalmente compatível com o Ultralytics YOLO11. É possível treinar e validar modelos diretamente utilizando o ficheiro de configuração YAML fornecido.

Onde posso encontrar o ficheiro de configuração do conjunto de dados kitti?

Pode aceder ao ficheiro YAML em ultralytics



📅 Criado há 0 dias ✏️ Atualizado há 0 dias

Comentários