Link to this sectionDataset Argoverse#

Name: Dataset di Rilevamento Argoverse
Creator: Argo AI
License: https://creativecommons.org/licenses/by-nc-sa/4.0/
Keywords: dataset Argoverse, Argoverse-HD, object detection, Rilevamento 2D, guida autonoma, dataset auto a guida autonoma, YOLO26, rilevamento traffico, Ultralytics

Il dataset Ultralytics Argoverse (Argoverse-HD) è un dataset di object detection 2D composto da 54.446 immagini etichettate di guida autonoma — 39.384 per l'addestramento e 15.062 per la validazione — distribuite in 8 classi: persona, bicicletta, auto, motocicletta, autobus, camion, semaforo e segnale di stop. Le immagini sono riprese dalla fotocamera frontale centrale di un veicolo e le annotazioni provengono dal progetto di streaming-perception della Carnegie Mellon University, basato sui dati di guida Argoverse 1.1 di Argo AI. Si tratta di un ampio benchmark nel mondo reale per l'addestramento di modelli di computer vision per rilevare oggetti stradali in scenari di guida autonoma.

Download manuale richiesto

Il file *.zip di Argoverse-HD (circa 31,5 GB) necessario per l'addestramento è stato rimosso da Amazon S3 dopo la chiusura di Argo AI da parte di Ford. È disponibile per il download manuale da Google Drive — il download automatico non funzionerà, quindi scarica l'archivio prima dell'addestramento.

Link to this sectionCaratteristiche principali#

8 classi di object-detection: persona, bicicletta, auto, motocicletta, autobus, camion, semaforo e segnale di stop.
54.446 immagini etichettate — 39.384 per l'addestramento e 15.062 per la validazione — più un set di test non etichettato riservato alla eval.ai challenge.
~31,5 GB di fotogrammi ad alta risoluzione acquisiti dalla fotocamera frontale centrale in scene di guida autonoma urbana.
Le annotazioni vengono convertite automaticamente nel formato YOLO al primo utilizzo, quindi il dataset si addestra direttamente con i modelli di rilevamento Ultralytics YOLO.

Link to this sectionStruttura del dataset#

Il dataset Argoverse-HD è diviso in tre subset predefiniti, definiti dalla configurazione Argoverse.yaml:

Split	Immagini	Etichette
Addestramento	39.384	Sì
Validazione	15.062	Sì
Test	—	Non etichettato (eval.ai challenge)

Tutte le immagini condividono le stesse 8 classi di oggetti (indici 0–7): persona, bicicletta, auto, motocicletta, autobus, camion, semaforo e segnale di stop.

Conversione YOLO automatica

Dopo il download manuale, Ultralytics converte automaticamente le annotazioni originali di Argoverse-HD in etichette di rilevamento YOLO la prima volta che esegui l'addestramento, quindi non è necessaria alcuna pre-elaborazione manuale.

Link to this sectionApplicazioni#

Il dataset Argoverse-HD supporta una gamma di applicazioni di object detection nella guida autonoma:

Percezione per guida autonoma — rileva veicoli, pedoni e ciclisti da una fotocamera rivolta in avanti per supportare la navigazione dei veicoli autonomi.
Sistemi avanzati di assistenza alla guida (ADAS) — riconosce semafori e segnali di stop per avvisi al conducente in tempo reale.
Monitoraggio del traffico — conta e traccia gli utenti della strada in contesti urbani per l'analisi delle smart-city.
Ricerca e prototipazione — un ampio benchmark reale per imparare l'addestramento del modello e la predizione sui dati di guida.

Link to this sectionDataset YAML#

Un file YAML definisce la configurazione del dataset, inclusi percorsi, classi e altri dettagli rilevanti. Per il dataset Argoverse, il file Argoverse.yaml è mantenuto su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/Argoverse.yaml.

ultralytics/cfg/datasets/Argoverse.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Argoverse-HD dataset (ring-front-center camera) by Argo AI: https://www.cs.cmu.edu/~mengtial/proj/streaming/
# Documentation: https://docs.ultralytics.com/datasets/detect/argoverse
# Example usage: yolo train data=Argoverse.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── Argoverse ← downloads here (31.5 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: Argoverse # dataset root dir
train: Argoverse-1.1/images/train/ # train images (relative to 'path') 39384 images
val: Argoverse-1.1/images/val/ # val images (relative to 'path') 15062 images
test: Argoverse-1.1/images/test/ # test images (optional) https://eval.ai/web/challenges/challenge-page/800/overview

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: bus
  5: truck
  6: traffic_light
  7: stop_sign

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  import json
  from pathlib import Path

  from ultralytics.utils import TQDM
  from ultralytics.utils.downloads import download

  def argoverse2yolo(annotation_file):
      """Convert Argoverse dataset annotations to YOLO format for object detection tasks."""
      labels = {}
      with open(annotation_file, encoding="utf-8") as f:
          a = json.load(f)
      for annot in TQDM(a["annotations"], desc=f"Converting {annotation_file} to YOLO format..."):
          img_id = annot["image_id"]
          img_name = a["images"][img_id]["name"]
          img_label_name = f"{Path(img_name).stem}.txt"

          cls = annot["category_id"]  # instance class id
          x_center, y_center, width, height = annot["bbox"]
          x_center = (x_center + width / 2) / 1920.0  # offset and scale
          y_center = (y_center + height / 2) / 1200.0  # offset and scale
          width /= 1920.0  # scale
          height /= 1200.0  # scale

          img_dir = annotation_file.parents[2] / "Argoverse-1.1" / "labels" / a["seq_dirs"][a["images"][annot["image_id"]]["sid"]]
          if not img_dir.exists():
              img_dir.mkdir(parents=True, exist_ok=True)

          k = str(img_dir / img_label_name)
          if k not in labels:
              labels[k] = []
          labels[k].append(f"{cls} {x_center} {y_center} {width} {height}\n")

      for k in labels:
          with open(k, "w", encoding="utf-8") as f:
              f.writelines(labels[k])

  # Download 'https://argoverse-hd.s3.amazonaws.com/Argoverse-HD-Full.zip' (deprecated S3 link)
  dir = Path(yaml["path"])  # dataset root dir
  urls = ["https://drive.google.com/file/d/1st9qW3BeIwQsnR0t8mRpvbsSWIo16ACi/view?usp=drive_link"]
  print("\n\nWARNING: Argoverse dataset MUST be downloaded manually, autodownload will NOT work.")
  print(f"WARNING: Manually download Argoverse dataset '{urls[0]}' to '{dir}' and re-run your command.\n\n")
  # download(urls, dir=dir)

  # Convert
  annotations_dir = "Argoverse-HD/annotations/"
  (dir / "Argoverse-1.1" / "tracking").rename(dir / "Argoverse-1.1" / "images")  # rename 'tracking' to 'images'
  for d in "train.json", "val.json":
      argoverse2yolo(dir / annotations_dir / d)  # convert Argoverse annotations to YOLO labels

Link to this sectionUtilizzo#

Per addestrare un modello YOLO26n sul dataset Argoverse per 100 epoche con una dimensione immagine di 640, usa i seguenti esempi di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Addestramento del modello.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

Una volta addestrato, esegui l'inferenza con il modello ottimizzato su nuove immagini o video di guida:

Esempio di inferenza

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load an Argoverse fine-tuned model

# Inference using the model
results = model.predict("path/to/driving-scene.jpg")

Link to this sectionDati di esempio e annotazioni#

Il dataset Argoverse-HD contiene immagini di guida ad alta risoluzione acquisite da una fotocamera frontale centrale, annotate con bounding box 2D per le 8 classi di oggetti. Di seguito è riportata un'immagine di esempio dal dataset con le relative annotazioni:

Scena di guida autonoma Argoverse-HD con oggetti stradali annotati

Scena di guida annotata: Questa immagine mostra oggetti stradali — come veicoli e pedoni — etichettati con bounding box 2D, il formato che i modelli YOLO imparano a predire durante l'addestramento.

Link to this sectionCitazioni e riconoscimenti#

Le annotazioni di rilevamento 2D di Argoverse-HD utilizzate in questo dataset provengono dal lavoro di streaming-perception della Carnegie Mellon University. Se utilizzi il dataset nella tua ricerca o sviluppo, ti preghiamo di citare:

Citazione

@inproceedings{li2020towards,
  title={Towards Streaming Perception},
  author={Li, Mengtian and Wang, Yu-Xiong and Ramanan, Deva},
  booktitle={Proceedings of the European Conference on Computer Vision (ECCV)},
  pages={473--488},
  year={2020}
}

@inproceedings{chang2019argoverse,
  title={Argoverse: 3D Tracking and Forecasting with Rich Maps},
  author={Chang, Ming-Fang and Lambert, John and Sangkloy, Patsorn and Singh, Jagjeet and Bak, Slawomir and Hartnett, Andrew and Wang, Dequan and Carr, Peter and Lucey, Simon and Ramanan, Deva and others},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={8748--8757},
  year={2019}
}

Vorremmo ringraziare la Carnegie Mellon University per le annotazioni di rilevamento Argoverse-HD e Argo AI per aver creato il dataset Argoverse originale come risorsa preziosa per la comunità di ricerca sulla guida autonoma.

Link to this sectionFAQ#

Link to this sectionCos'è il dataset Argoverse e a cosa serve?#

Il dataset Ultralytics Argoverse (Argoverse-HD) è un dataset di object detection 2D di 54.446 immagini di guida autonoma suddivise in 8 classi — persona, bicicletta, auto, motocicletta, autobus, camion, semaforo e segnale di stop. Viene utilizzato per addestrare e valutare modelli che rilevano oggetti stradali da una fotocamera frontale del veicolo, supportando la percezione per guida autonoma, gli ADAS e la ricerca sul monitoraggio del traffico.

Link to this sectionQuante classi e immagini sono presenti nel dataset Argoverse?#

Il dataset Argoverse-HD ha 8 classi (persona, bicicletta, auto, motocicletta, autobus, camion, semaforo e segnale di stop) e 54.446 immagini etichettate — 39.384 per l'addestramento e 15.062 per la validazione — più un set di test non etichettato riservato alla eval.ai challenge.

Link to this sectionIl dataset Argoverse è per il rilevamento 2D o 3D in Ultralytics?#

In Ultralytics è un dataset di object detection 2D (fotogrammi della fotocamera Argoverse-HD con bounding box 2D), non la suite di ricerca per il 3D-tracking, previsione del movimento o LiDAR dal più ampio programma Argoverse. Lo addestri con un modello di rilevamento standard come yolo26n.pt.

Link to this sectionCome posso addestrare un modello YOLO26 utilizzando il dataset Argoverse?#

Scarica prima il dataset manualmente (vedi sotto), quindi addestra con il file di configurazione Argoverse.yaml:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="Argoverse.yaml", epochs=100, imgsz=640)

Per una spiegazione dettagliata degli argomenti, fai riferimento alla pagina di Training del modello.

Link to this sectionDove posso scaricare il dataset Argoverse ora che è stato rimosso da Amazon S3?#

Il file *.zip di Argoverse-HD (circa 31,5 GB), precedentemente ospitato su Amazon S3, può ora essere scaricato manualmente da Google Drive. Il download automatico non funzionerà, quindi recupera l'archivio prima di eseguire il comando di addestramento.

Link to this sectionPosso usare il dataset Argoverse con la Ultralytics Platform?#

Sì. La Ultralytics Platform ti permette di caricare e gestire versioni di grandi dataset come Argoverse-HD, quindi di addestrare e distribuire modelli di object detection nel cloud senza una pesante configurazione locale. Puoi anche esplorare dataset correlati nella panoramica dei dataset di rilevamento.

Collaboratori

GLglenn-jocher¹³ RAraimbekovm³ MAMatthewNoyce¹ RIRizwanMunawar¹

Creato 12 nov 2023Aggiornato ieri