Set di dati DOTA8
Introduzione
Ultralytics DOTA8 è un piccolo ma versatile set di dati orientati al rilevamento di oggetti, composto dalle prime 8 immagini del set diviso DOTAv1, 4 per l'addestramento e 4 per la validazione. Questo set di dati è ideale per il test e il debug dei modelli di rilevamento degli oggetti o per sperimentare nuovi approcci di rilevamento. Con 8 immagini, è abbastanza piccolo da essere facilmente gestibile, ma sufficientemente diversificato per testare le pipeline di addestramento alla ricerca di errori e per fungere da verifica della correttezza prima di addestrare set di dati più grandi.
Questo set di dati è destinato all'utilizzo di Ultralytics HUB e di YOLO11.
Set di dati YAML
Un file YAML (Yet Another Markup Language) è usato per definire la configurazione del dataset. Contiene informazioni sui percorsi del dataset, sulle classi e altre informazioni rilevanti. Nel caso del set di dati DOTA8, il file dota8.yaml
Il file viene mantenuto all'indirizzo https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Utilizzo
Per addestrare un modello YOLO11n-obb sul dataset DOTA8 per 100 epoch con una dimensione dell'immagine di 640, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.
Esempio di treno
Immagini di esempio e annotazioni
Ecco alcuni esempi di immagini tratte dal dataset DOTA8, con le relative annotazioni:
- Immagine a mosaico: Questa immagine mostra un batch di addestramento composto da immagini del dataset mosaicate. La mosaicatura è una tecnica utilizzata durante l'addestramento che combina più immagini in un'unica immagine per aumentare la varietà di oggetti e scene all'interno di ciascun batch di addestramento. Ciò contribuisce a migliorare la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti di aspetto e contesti diversi.
L'esempio mostra la varietà e la complessità delle immagini del dataset DOTA8 e i vantaggi dell'uso della mosaicatura durante il processo di addestramento.
Citazioni e ringraziamenti
Se utilizzate il dataset DOTA nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Una nota speciale di gratitudine al team che si occupa dei dataset DOTA per l'encomiabile impegno profuso nel curare questo set di dati. Per una comprensione esaustiva del dataset e delle sue sfumature, visitate il sito ufficiale di DOTA.
FAQ
Che cos'è il dataset DOTA8 e come può essere utilizzato?
Il set di dati DOTA8 è un piccolo set di dati orientato al rilevamento di oggetti, composto dalle prime 8 immagini del set diviso DOTAv1, con 4 immagini designate per l'addestramento e 4 per la convalida. È ideale per il test e il debug di modelli di rilevamento degli oggetti come Ultralytics YOLO11 . Grazie alle sue dimensioni gestibili e alla sua diversità, aiuta a identificare gli errori della pipeline e a eseguire controlli di correttezza prima di distribuire set di dati più grandi. Per saperne di più sul rilevamento degli oggetti con Ultralytics YOLO11.
Come si addestra un modello YOLO11 utilizzando il dataset DOTA8?
Per addestrare un modello YOLO11n-obb sul dataset DOTA8 per 100 epoch con una dimensione dell'immagine di 640, si possono usare i seguenti frammenti di codice. Per le opzioni complete degli argomenti, consultare la pagina di addestramento del modello.
Esempio di treno
Quali sono le caratteristiche principali del dataset DOTA e dove posso accedere al file YAML?
Il set di dati DOTA è noto per il suo benchmark su larga scala e per le sfide che presenta per il rilevamento degli oggetti nelle immagini aeree. Il sottoinsieme DOTA8 è un set di dati più piccolo e maneggevole, ideale per i primi test. È possibile accedere al dota8.yaml
che contiene percorsi, classi e dettagli di configurazione, in questo file Collegamento a GitHub.
In che modo la mosaicatura migliora l'addestramento del modello con il dataset DOTA8?
La mosaicatura combina più immagini in una sola durante l'addestramento, aumentando la varietà di oggetti e contesti all'interno di ogni gruppo. Ciò migliora la capacità del modello di generalizzarsi a oggetti di dimensioni, rapporti di aspetto e scene diverse. Questa tecnica può essere dimostrata visivamente attraverso un batch di addestramento composto da immagini del dataset DOTA8 mosaicate, aiutando così lo sviluppo di modelli robusti. Per saperne di più sulla mosaicatura e sulle tecniche di addestramento, visitate la nostra pagina dedicata all'addestramento.
Perché utilizzare Ultralytics YOLO11 per le attività di rilevamento degli oggetti?
Ultralytics YOLO11 offre capacità di rilevamento degli oggetti in tempo reale all'avanguardia, comprese funzioni come le bounding box orientate (OBB), la segmentazione delle istanze e una pipeline di addestramento estremamente versatile. È adatto a diverse applicazioni e offre modelli preaddestrati per un'efficiente messa a punto. Per ulteriori informazioni sui vantaggi e sull'utilizzo, consultare la documentazione di Ultralytics YOLO11 .