Dataset DOTA8
Introduzione
Il DOTA8 di Ultralytics è un dataset versatile e di dimensioni ridotte per l'object detection orientata, composto dalle prime 8 immagini del set DOTAv1, 4 per il training e 4 per la validazione. Questo dataset è ideale per testare ed eseguire il debug di modelli di object detection, o per sperimentare con nuovi approcci di rilevamento. Con 8 immagini, è abbastanza piccolo da essere facilmente gestibile, ma sufficientemente diversificato per testare la presenza di errori nelle pipeline di training e fungere da controllo di integrità prima dell'addestramento su dataset più grandi.
Struttura del dataset
-
Immagini: 8 riquadri aerei (4 train, 4 val) provenienti da DOTAv1.
-
Classi: Eredita le 15 categorie DOTAv1 come aereo, nave e veicoli di grandi dimensioni.
-
Etichette: Bounding box orientate in formato YOLO salvate come file
.txtaccanto a ogni immagine. -
Layout consigliato:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Questo dataset è inteso per l'uso con Ultralytics Platform e YOLO26.
YAML del dataset
Un file YAML (Yet Another Markup Language) viene utilizzato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, le classi e altre informazioni rilevanti. Nel caso del dataset DOTA8, il file dota8.yaml è mantenuto all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zipUtilizzo
Per addestrare un modello YOLO26n-obb sul dataset DOTA8 per 100 epochs con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Immagini campione e annotazioni
Ecco alcuni esempi di immagini dal dataset DOTA8, insieme alle relative annotazioni:
- Immagine a mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset a mosaico. Il mosaico è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ogni batch di addestramento. Ciò aiuta a migliorare la capacità del modello di generalizzare a diverse dimensioni, proporzioni e contesti degli oggetti.
L'esempio mostra la varietà e la complessità delle immagini nel dataset DOTA8 e i vantaggi dell'utilizzo del mosaicing durante il processo di training.
Citazioni e ringraziamenti
Se utilizzi il dataset DOTA nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Un ringraziamento speciale al team dietro i dataset DOTA per il loro lodevole impegno nella cura di questo dataset. Per una comprensione esaustiva del dataset e delle sue sfumature, visita il sito ufficiale DOTA.
FAQ
Cos'è il dataset DOTA8 e come può essere utilizzato?
Il dataset DOTA8 è un dataset versatile e di dimensioni ridotte per l'object detection orientata, composto dalle prime 8 immagini del set DOTAv1, con 4 immagini designate per il training e 4 per la validazione. È ideale per testare ed eseguire il debug di modelli di object detection come Ultralytics YOLO26. Grazie alle sue dimensioni gestibili e alla sua diversità, aiuta a identificare errori nella pipeline ed eseguire controlli di integrità prima di utilizzare dataset più grandi. Scopri di più sull'object detection con Ultralytics YOLO26.
Come posso addestrare un modello YOLO26 utilizzando il dataset DOTA8?
Per addestrare un modello YOLO26n-obb sul dataset DOTA8 per 100 epoche con una dimensione dell'immagine di 640, puoi utilizzare i seguenti frammenti di codice. Per opzioni di argomenti complete, fai riferimento alla pagina di Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Quali sono le caratteristiche principali del dataset DOTA e dove posso accedere al file YAML?
Il dataset DOTA è noto per il suo benchmark su larga scala e per le sfide che presenta per l'object detection in immagini aeree. Il subset DOTA8 è un dataset più piccolo e gestibile, ideale per i test iniziali. Puoi accedere al file dota8.yaml, che contiene percorsi, classi e dettagli di configurazione, tramite questo link GitHub.
In che modo il mosaicing migliora l'addestramento del modello con il dataset DOTA8?
Il mosaicing combina più immagini in una sola durante l'addestramento, aumentando la varietà di oggetti e contesti all'interno di ogni batch. Ciò migliora la capacità di un modello di generalizzare a diverse dimensioni degli oggetti, proporzioni e scene. Questa tecnica può essere dimostrata visivamente attraverso un batch di training composto da immagini del dataset DOTA8 sottoposte a mosaicing, aiutando nello sviluppo di modelli robusti. Esplora di più sul mosaicing e sulle tecniche di addestramento nella nostra pagina Training.
Perché dovrei usare Ultralytics YOLO26 per attività di object detection?
Ultralytics YOLO26 offre funzionalità di object detection in tempo reale all'avanguardia, incluse caratteristiche come bounding box orientate (OBB), instance segmentation e una pipeline di addestramento altamente versatile. È adatto a varie applicazioni e offre modelli preaddestrati per un fine-tuning efficiente. Esplora ulteriormente i vantaggi e l'utilizzo nella documentazione di Ultralytics YOLO26.