Link to this sectionDataset Argoverse#

Name: Conjunto de Dados de Detecção Argoverse
Creator: Argo AI
License: https://creativecommons.org/licenses/by-nc-sa/4.0/
Keywords: Dataset Argoverse, Argoverse-HD, detecção de objetos, Detecção 2D, condução autónoma, conjunto de dados de carro autônomo, YOLO26, detecção de tráfego, Ultralytics

O conjunto de dados Ultralytics Argoverse (Argoverse-HD) é um conjunto de dados de detecção de objetos 2D com 54.446 imagens rotuladas de condução autônoma — 39.384 para treinamento e 15.062 para validação — distribuídas em 8 classes: pessoa, bicicleta, carro, motocicleta, ônibus, caminhão, semáforo e placa de pare. As imagens são capturadas pela câmera frontal central de um veículo, e as anotações provêm do projeto de percepção em fluxo da Carnegie Mellon University, construído sobre os dados de direção do Argoverse 1.1 da Argo AI. É um benchmark grande e do mundo real para treinar modelos de visão computacional para detectar objetos na estrada em cenários de condução autônoma.

Download manual necessário

O arquivo *.zip do Argoverse-HD (~31,5 GB) necessário para o treinamento foi removido do Amazon S3 após o encerramento da Argo AI pela Ford. Ele está disponível para download manual no Google Drive — o download automático não funcionará, portanto, baixe o arquivo antes do treinamento.

Link to this sectionPrincipais recursos#

8 classes de detecção de objetos: pessoa, bicicleta, carro, motocicleta, ônibus, caminhão, semáforo e placa de pare.
54.446 imagens rotuladas — 39.384 para treinamento e 15.062 para validação — além de um conjunto de testes não rotulado reservado para o desafio eval.ai.
~31,5 GB de quadros de câmera frontal central de alta resolução capturados em cenas de direção autônoma urbana.
As anotações são convertidas automaticamente para o formato YOLO no primeiro uso, portanto, o conjunto de dados treina diretamente com os modelos de detecção Ultralytics YOLO.

Link to this sectionEstrutura do Dataset#

O conjunto de dados Argoverse-HD é dividido em três subconjuntos predefinidos, definidos pela configuração Argoverse.yaml:

Divisão	Imagens	Etiquetas
Treinar	39.384	Sim
Validação	15.062	Sim
Teste	—	Não rotulado (desafio eval.ai)

Todas as imagens compartilham as mesmas 8 classes de objetos (índices 0–7): pessoa, bicicleta, carro, motocicleta, ônibus, caminhão, semáforo e placa de pare.

Conversão automática YOLO

Após o download manual, o Ultralytics converte automaticamente as anotações originais do Argoverse-HD em rótulos de detecção YOLO na primeira vez que você treinar, portanto, não é necessário pré-processamento manual.

Link to this sectionAplicações#

O conjunto de dados Argoverse-HD suporta uma variedade de aplicações de detecção de objetos em direção autônoma:

Percepção de condução autônoma — detecta veículos, pedestres e ciclistas a partir de uma câmera frontal para apoiar a navegação de veículos autônomos.
Sistemas avançados de assistência ao condutor (ADAS) — reconhece semáforos e placas de pare para alertas ao motorista em tempo real.
Monitoramento de tráfego — conta e rastreia usuários da estrada em cenas urbanas para análises de cidades inteligentes.
Pesquisa e prototipagem — um benchmark grande e do mundo real para aprender treinamento de modelos e predição em dados de direção.

Link to this sectionYAML do Dataset#

Um arquivo YAML define a configuração do dataset, incluindo caminhos, classes e outros detalhes relevantes. Para o dataset Argoverse, o arquivo Argoverse.yaml é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/Argoverse.yaml.

ultralytics/cfg/datasets/Argoverse.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Argoverse-HD dataset (ring-front-center camera) by Argo AI: https://www.cs.cmu.edu/~mengtial/proj/streaming/
# Documentation: https://docs.ultralytics.com/datasets/detect/argoverse
# Example usage: yolo train data=Argoverse.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── Argoverse ← downloads here (31.5 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: Argoverse # dataset root dir
train: Argoverse-1.1/images/train/ # train images (relative to 'path') 39384 images
val: Argoverse-1.1/images/val/ # val images (relative to 'path') 15062 images
test: Argoverse-1.1/images/test/ # test images (optional) https://eval.ai/web/challenges/challenge-page/800/overview

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: bus
  5: truck
  6: traffic_light
  7: stop_sign

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  import json
  from pathlib import Path

  from ultralytics.utils import TQDM
  from ultralytics.utils.downloads import download

  def argoverse2yolo(annotation_file):
      """Convert Argoverse dataset annotations to YOLO format for object detection tasks."""
      labels = {}
      with open(annotation_file, encoding="utf-8") as f:
          a = json.load(f)
      for annot in TQDM(a["annotations"], desc=f"Converting {annotation_file} to YOLO format..."):
          img_id = annot["image_id"]
          img_name = a["images"][img_id]["name"]
          img_label_name = f"{Path(img_name).stem}.txt"

          cls = annot["category_id"]  # instance class id
          x_center, y_center, width, height = annot["bbox"]
          x_center = (x_center + width / 2) / 1920.0  # offset and scale
          y_center = (y_center + height / 2) / 1200.0  # offset and scale
          width /= 1920.0  # scale
          height /= 1200.0  # scale

          img_dir = annotation_file.parents[2] / "Argoverse-1.1" / "labels" / a["seq_dirs"][a["images"][annot["image_id"]]["sid"]]
          if not img_dir.exists():
              img_dir.mkdir(parents=True, exist_ok=True)

          k = str(img_dir / img_label_name)
          if k not in labels:
              labels[k] = []
          labels[k].append(f"{cls} {x_center} {y_center} {width} {height}\n")

      for k in labels:
          with open(k, "w", encoding="utf-8") as f:
              f.writelines(labels[k])

  # Download 'https://argoverse-hd.s3.amazonaws.com/Argoverse-HD-Full.zip' (deprecated S3 link)
  dir = Path(yaml["path"])  # dataset root dir
  urls = ["https://drive.google.com/file/d/1st9qW3BeIwQsnR0t8mRpvbsSWIo16ACi/view?usp=drive_link"]
  print("\n\nWARNING: Argoverse dataset MUST be downloaded manually, autodownload will NOT work.")
  print(f"WARNING: Manually download Argoverse dataset '{urls[0]}' to '{dir}' and re-run your command.\n\n")
  # download(urls, dir=dir)

  # Convert
  annotations_dir = "Argoverse-HD/annotations/"
  (dir / "Argoverse-1.1" / "tracking").rename(dir / "Argoverse-1.1" / "images")  # rename 'tracking' to 'images'
  for d in "train.json", "val.json":
      argoverse2yolo(dir / annotations_dir / d)  # convert Argoverse annotations to YOLO labels

Link to this sectionUso#

Para treinar um modelo YOLO26n no conjunto de dados Argoverse por 100 épocas com um tamanho de imagem de 640, use os seguintes exemplos de código. Para obter uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

Após o treinamento, execute a inferência com o modelo ajustado em novas imagens ou vídeos de direção:

Exemplo de Inferência

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load an Argoverse fine-tuned model

# Inference using the model
results = model.predict("path/to/driving-scene.jpg")

Link to this sectionDados de Amostra e Anotações#

O conjunto de dados Argoverse-HD contém imagens de direção de alta resolução capturadas de uma câmera frontal central, anotadas com caixas delimitadoras 2D para as 8 classes de objetos. Abaixo está um exemplo de imagem do conjunto de dados com suas anotações correspondentes:

Cena de direção autônoma Argoverse-HD com objetos de estrada anotados

Cena de direção anotada: Esta imagem mostra objetos na estrada — como veículos e pedestres — rotulados com caixas delimitadoras 2D, o formato que os modelos YOLO aprendem a prever durante o treinamento.

Link to this sectionCitações e Agradecimentos#

As anotações de detecção 2D do Argoverse-HD usadas neste conjunto de dados provêm do trabalho de percepção em fluxo da Carnegie Mellon University. Se você utilizar o conjunto de dados em sua pesquisa ou desenvolvimento, por favor, cite:

Citação

@inproceedings{li2020towards,
  title={Towards Streaming Perception},
  author={Li, Mengtian and Wang, Yu-Xiong and Ramanan, Deva},
  booktitle={Proceedings of the European Conference on Computer Vision (ECCV)},
  pages={473--488},
  year={2020}
}

@inproceedings{chang2019argoverse,
  title={Argoverse: 3D Tracking and Forecasting with Rich Maps},
  author={Chang, Ming-Fang and Lambert, John and Sangkloy, Patsorn and Singh, Jagjeet and Bak, Slawomir and Hartnett, Andrew and Wang, Dequan and Carr, Peter and Lucey, Simon and Ramanan, Deva and others},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={8748--8757},
  year={2019}
}

Gostaríamos de agradecer à Carnegie Mellon University pelas anotações de detecção do Argoverse-HD e à Argo AI pela criação do conjunto de dados Argoverse original como um recurso valioso para a comunidade de pesquisa em condução autônoma.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados Argoverse e para que é usado?#

O conjunto de dados Ultralytics Argoverse (Argoverse-HD) é um conjunto de dados de detecção de objetos 2D de 54.446 imagens de condução autônoma em 8 classes — pessoa, bicicleta, carro, motocicleta, ônibus, caminhão, semáforo e placa de pare. Ele é usado para treinar e avaliar modelos que detectam objetos na estrada a partir de uma câmera frontal de veículo, apoiando a percepção de condução autônoma, ADAS e pesquisas de monitoramento de tráfego.

Link to this sectionQuantas classes e imagens existem no conjunto de dados Argoverse?#

O conjunto de dados Argoverse-HD possui 8 classes (pessoa, bicicleta, carro, motocicleta, ônibus, caminhão, semáforo e placa de pare) e 54.446 imagens rotuladas — 39.384 para treinamento e 15.062 para validação — além de um conjunto de testes não rotulado reservado para o desafio eval.ai.

Link to this sectionO conjunto de dados Argoverse é de detecção 2D ou 3D no Ultralytics?#

No Ultralytics, é um conjunto de dados de detecção de objetos 2D (quadros de câmera Argoverse-HD com caixas delimitadoras 2D), não o conjunto de pesquisa de rastreamento 3D, previsão de movimento ou LiDAR do programa Argoverse mais amplo. Você o treina com um modelo de detecção padrão como yolo26n.pt.

Link to this sectionComo treino um modelo YOLO26 usando o conjunto de dados Argoverse?#

Baixe o conjunto de dados manualmente primeiro (veja abaixo), depois treine com o arquivo de configuração Argoverse.yaml:

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

Para uma explicação detalhada dos argumentos, consulta a página de Treino do modelo.

Link to this sectionOnde posso transferir o dataset Argoverse agora que foi removido da Amazon S3?#

O arquivo *.zip do Argoverse-HD (~31,5 GB), anteriormente hospedado no Amazon S3, agora pode ser baixado manualmente no Google Drive. O download automático não funcionará, então busque o arquivo antes de executar seu comando de treinamento.

Link to this sectionPosso usar o conjunto de dados Argoverse com a Plataforma Ultralytics?#

Sim. A Plataforma Ultralytics permite que você carregue e gerencie versões de grandes conjuntos de dados como o Argoverse-HD, e então treine e implante modelos de detecção de objetos na nuvem sem uma configuração local pesada. Você também pode explorar conjuntos de dados relacionados na visão geral dos conjuntos de dados de detecção.

Contribuidores

GLglenn-jocher¹³ RAraimbekovm³ MAMatthewNoyce¹ RIRizwanMunawar¹

Criado 12 de nov. de 2023Atualizado anteontem