Vai al contenuto

Set di dati DOTA8

Introduzione

Ultralytics DOTA8 è un piccolo ma versatile set di dati per il rilevamento di oggetti, composto dalle prime 8 immagini del set DOTAv1, 4 per la formazione e 4 per la validazione. Questo set di dati è l'ideale per testare e debuggare i modelli di rilevamento degli oggetti o per sperimentare nuovi approcci di rilevamento. Con 8 immagini, è abbastanza piccolo da essere facilmente gestibile, ma sufficientemente vario da poter testare le pipeline di addestramento per verificare la presenza di errori e fungere da verifica della correttezza prima di addestrare set di dati più grandi.

Questo set di dati è destinato all'utilizzo di Ultralytics HUB e di YOLOv8.

Set di dati YAML

Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, sulle classi e altre informazioni rilevanti. Nel caso del dataset DOTA8, il file dota8.yaml Il file viene mantenuto all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilizzo

Per addestrare un modello YOLOv8n-obb sul dataset DOTA8 per 100 epoch con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Immagini di esempio e annotazioni

Ecco alcuni esempi di immagini tratte dal dataset DOTA8, con le relative annotazioni:

Immagine campione del set di dati

  • Immagine a mosaico: Questa immagine mostra un lotto di formazione composto da immagini del dataset mosaicate. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni gruppo di addestramento. Questo aiuta a migliorare la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti di aspetto e contesti diversi.

L'esempio mostra la varietà e la complessità delle immagini del dataset DOTA8 e i vantaggi dell'utilizzo della mosaicatura durante il processo di formazione.

Citazioni e ringraziamenti

Se utilizzi il dataset DOTA nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Una nota speciale di gratitudine al team che si occupa dei dataset DOTA per il loro encomiabile impegno nella cura di questo set di dati. Per una comprensione esaustiva del dataset e delle sue sfumature, visita il sito ufficiale di DOTA.

DOMANDE FREQUENTI

Che cos'è il dataset DOTA8 e come può essere utilizzato?

Il set di dati DOTA8 è un piccolo set di dati orientato al rilevamento di oggetti, composto dalle prime 8 immagini del set diviso DOTAv1, con 4 immagini destinate all'addestramento e 4 alla convalida. È l'ideale per testare e testare i modelli di rilevamento degli oggetti come Ultralytics YOLOv8 . Grazie alle sue dimensioni gestibili e alla sua diversità, aiuta a identificare gli errori della pipeline e a eseguire controlli di correttezza prima di distribuire set di dati più grandi. Scopri di più sul rilevamento degli oggetti con Ultralytics YOLOv8.

Come si addestra un modello YOLOv8 utilizzando il dataset DOTA8?

Per addestrare un modello YOLOv8n-obb sul dataset DOTA8 per 100 epoch con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per le opzioni complete degli argomenti, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Quali sono le caratteristiche principali del dataset DOTA e dove posso accedere al file YAML?

Il set di dati DOTA è noto per il suo benchmark su larga scala e per le sfide che presenta per il rilevamento degli oggetti nelle immagini aeree. Il sottoinsieme DOTA8 è un set di dati più piccolo e maneggevole, ideale per i primi test. Puoi accedere al dota8.yaml che contiene i percorsi, le classi e i dettagli della configurazione, a questo indirizzo Collegamento a GitHub.

In che modo la mosaicatura migliora l'addestramento dei modelli con il dataset DOTA8?

La mosaicatura combina più immagini in una sola durante l'addestramento, aumentando la varietà di oggetti e contesti all'interno di ogni gruppo. Questo migliora la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti d'aspetto e scene diverse. Questa tecnica può essere dimostrata visivamente attraverso un batch di addestramento composto da immagini del dataset DOTA8 mosaicate, aiutando lo sviluppo di modelli robusti. Per saperne di più sulla mosaicatura e sulle tecniche di addestramento, visita la nostra pagina dedicata alla formazione.

Perché dovrei utilizzare Ultralytics YOLOv8 per le attività di rilevamento degli oggetti?

Ultralytics YOLOv8 offre funzionalità di rilevamento degli oggetti in tempo reale all'avanguardia, tra cui funzioni come le bounding box orientate (OBB), la segmentazione delle istanze e una pipeline di addestramento estremamente versatile. È adatto a diverse applicazioni e offre modelli preaddestrati per un'efficiente messa a punto. Per saperne di più sui vantaggi e l'utilizzo, consulta la documentazione di Ultralytics YOLOv8 .



Creato 2024-01-09, Aggiornato 2024-07-04
Autori: glenn-jocher (3), Laughing-q (1)

Commenti