Dataset DOTA128
Introduzione
Ultralytics DOTA128 è un piccolo ma versatile set di dati object detection composto da 128 immagini tratte dal set DOTAv1, 128 per l'addestramento e la validazione. Questo dataset è ideale per testare ed eseguire il debug di modelli con oriented bounding box (OBB), o per sperimentare con nuovi approcci di rilevamento. Con 128 immagini, è abbastanza piccolo da essere facilmente gestibile, ma abbastanza diversificato da testare le pipeline di addestramento alla ricerca di errori e fungere da controllo di validità prima di addestrare dataset più grandi.
Struttura del dataset
- Immagini: 128 tile aeree (tutte nella cartella train, utilizzate sia per l'addestramento che per la validazione) provenienti da DOTAv1.
- Classi: Eredita le 15 categorie di DOTAv1 come aereo, nave e veicolo di grandi dimensioni.
- Etichette: Oriented bounding box in formato YOLO salvati come
.txtfile accanto a ogni immagine.
Questo set di dati è destinato all'uso con Ultralytics Platform e YOLO26.
YAML del dataset
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, le classi e altre informazioni rilevanti. Nel caso del dataset DOTA128, il dota128.yaml è mantenuto su https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipUtilizzo
Per addestrare un modello YOLO26n-obb sul dataset DOTA128 per 100 epochs con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento al modello Addestramento.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Immagini campione e annotazioni
Ecco alcuni esempi di immagini dal dataset DOTA128, insieme alle relative annotazioni:
- Immagine Mosaiced: Questa immagine mostra un batch di addestramento composto da immagini del dataset elaborate tramite mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset DOTA128 e i vantaggi dell'utilizzo del mosaicing durante il processo di addestramento.
Citazioni e ringraziamenti
Se utilizzi il dataset DOTA nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Un ringraziamento speciale al team dietro i dataset DOTA per il loro lodevole impegno nella cura di questo dataset. Per una comprensione esaustiva del dataset e delle sue sfumature, visita il sito web ufficiale DOTA.
FAQ
Cos'è il dataset DOTA128 e come può essere utilizzato?
Il dataset DOTA128 è un versatile dataset di rilevamento di oggetti orientati composto da 128 immagini dal set DOTAv1, tutte archiviate nella cartella train. Sia l'addestramento che la validazione utilizzano lo stesso set di immagini, rendendolo ideale per flussi di lavoro di test e debug rapidi. È ideale per testare ed eseguire il debug di modelli OBB come Ultralytics YOLO26. Grazie alle sue dimensioni gestibili e alla diversità, aiuta a identificare gli errori nella pipeline ed eseguire controlli di validità prima di distribuire dataset più grandi. Scopri di più sul rilevamento OBB con Ultralytics YOLO26.
Come posso addestrare un modello YOLO26 utilizzando il dataset DOTA128?
Per addestrare un modello YOLO26n-obb sul dataset DOTA128 per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per opzioni di argomenti complete, fai riferimento al modello Addestramento.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Quali sono le caratteristiche principali del dataset DOTA e dove posso accedere al file YAML?
Il dataset DOTA è noto per il suo benchmark su larga scala e le sfide che presenta per il rilevamento di oggetti in immagini aeree. Il sottoinsieme DOTA128 offre una maggiore diversità rispetto a DOTA8 pur rimanendo gestibile per i test iniziali. Puoi accedere al dota128.yaml file, che contiene percorsi, classi e dettagli di configurazione, in questo link di GitHub.
Come si confronta DOTA128 con le altre varianti del dataset DOTA?
DOTA128 (128 immagini) si colloca tra DOTA8 (8 immagini) e il DOTA-v1 dataset (1.869 immagini) in termini di dimensioni:
- DOTA8: Contiene solo 8 immagini (4 train, 4 val) - ideale per test rapidi e debug
- DOTA128: Contiene 128 immagini (tutte nella cartella train, utilizzate sia per l'addestramento che per la validazione) - equilibrato tra dimensioni e diversità
- DOTA-v1 completo: Contiene 1.869 immagini - completo ma ad alta intensità di risorse
DOTA128 fornisce un buon compromesso, offrendo maggiore diversità rispetto a DOTA8 pur rimanendo molto più gestibile rispetto al dataset DOTA completo per la sperimentazione e lo sviluppo iniziale del modello.
Come migliora il mosaicing l'addestramento del modello con il dataset DOTA128?
Il mosaicing combina più immagini in una sola durante l'addestramento, aumentando la varietà di oggetti e contesti all'interno di ogni batch. Ciò migliora la capacità di un modello di generalizzare a diverse dimensioni di oggetti, proporzioni e scene. Questa tecnica può essere dimostrata visivamente attraverso un batch di addestramento composto da immagini del dataset DOTA128 sottoposte a mosaicing, aiutando nello sviluppo di un modello robusto. Esplora di più sul mosaicing e sulle tecniche di addestramento sulla nostra Addestramento.
Perché dovrei usare Ultralytics YOLO26 per compiti di rilevamento di oggetti orientati?
Ultralytics YOLO26 offre funzionalità di rilevamento oggetti in tempo reale all'avanguardia, incluse caratteristiche come oriented bounding boxes (OBB), instance segmentatione una pipeline di addestramento altamente versatile. È adatto a varie applicazioni e offre modelli preaddestrati per un efficiente fine-tuning. Esplora ulteriormente i vantaggi e l'utilizzo nella documentazione di Ultralytics YOLO26.