Dataset DOTA8
Introduzione
Ultralytics DOTA8 è un piccolo ma versatile dataset orientato di object detection composto dalle prime 8 immagini del set DOTAv1 diviso, 4 per l'addestramento e 4 per la convalida. Questo dataset è ideale per testare ed eseguire il debug di modelli di object detection o per sperimentare nuovi approcci di detection. Con 8 immagini, è abbastanza piccolo da essere facilmente gestibile, ma abbastanza diversificato da testare le pipeline di addestramento per gli errori e fungere da controllo di integrità prima di addestrare dataset più grandi.
Struttura del set di dati
- Immagini: 8 tile aeree (4 train, 4 val) provenienti da DOTAv1.
- Classi: Eredita le 15 categorie DOTAv1 come aereo, nave e veicolo di grandi dimensioni.
- Etichette: Bounding box orientati in formato YOLO salvati come
.txtfile accanto a ciascuna immagine. Layout raccomandato:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Questo dataset è destinato all'uso con Piattaforma Ultralytics e YOLO26.
YAML del set di dati
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Contiene informazioni sui percorsi, le classi e altre informazioni rilevanti del dataset. Nel caso del dataset DOTA8, il dota8.yaml file è mantenuto in https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Utilizzo
Per addestrare un modello YOLO26n-obb sul dataset DOTA8 per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina Addestramento del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Immagini di esempio e annotazioni
Ecco alcuni esempi di immagini del dataset DOTA8, insieme alle relative annotazioni:

- Immagine mosaicata: questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicato. Il mosaicing è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e contesti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset DOTA8 e i vantaggi dell'utilizzo del mosaicing durante il processo di training.
Citazioni e ringraziamenti
Se utilizzi il dataset DOTA nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Un ringraziamento speciale al team dietro i dataset DOTA per il loro lodevole impegno nella cura di questo dataset. Per una comprensione esaustiva del dataset e delle sue sfumature, visitare il sito web ufficiale di DOTA.
FAQ
Cos'è il dataset DOTA8 e come può essere utilizzato?
Il dataset DOTA8 è un dataset di object detection orientata piccolo e versatile, composto dalle prime 8 immagini del set DOTAv1, con 4 immagini designate per l'addestramento e 4 per la validazione. È ideale per testare e debuggare modelli di object detection come Ultralytics YOLO26. Grazie alle sue dimensioni gestibili e alla sua diversità, aiuta a identificare errori nella pipeline ed eseguire controlli di integrità prima di implementare dataset più grandi. Scopri di più sull'object detection con Ultralytics YOLO26.
Come si addestra un modello YOLO26 utilizzando il dataset DOTA8?
Per addestrare un modello YOLO26n-obb sul dataset DOTA8 per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per opzioni di argomenti complete, fai riferimento alla pagina Addestramento del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Quali sono le caratteristiche principali del dataset DOTA e dove posso accedere al file YAML?
Il dataset DOTA è noto per il suo benchmark su larga scala e le sfide che presenta per il rilevamento di oggetti in immagini aeree. Il sottoinsieme DOTA8 è un dataset più piccolo e gestibile, ideale per i test iniziali. È possibile accedere al dota8.yaml file, che contiene percorsi, classi e dettagli di configurazione, a questo Link GitHub.
In che modo il mosaicing migliora il training del modello con il dataset DOTA8?
Il mosaicing combina più immagini in una sola durante l'addestramento, aumentando la varietà di oggetti e contesti all'interno di ogni batch. Ciò migliora la capacità di un modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e scene. Questa tecnica può essere dimostrata visivamente attraverso un batch di addestramento composto da immagini del dataset DOTA8 in mosaico, aiutando nello sviluppo di un modello robusto. Scopri di più sul mosaicing e sulle tecniche di addestramento nella nostra pagina Addestramento.
Perché dovrei usare Ultralytics YOLO26 per attività di object detection?
Ultralytics YOLO26 offre capacità di object detection in tempo reale all'avanguardia, incluse funzionalità come le bounding box orientate (OBB), la instance segmentation e una pipeline di addestramento altamente versatile. È adatto a diverse applicazioni e offre modelli pre-addestrati per un fine-tuning efficiente. Esplora ulteriormente i vantaggi e l'utilizzo nella documentazione di Ultralytics YOLO26.