DOTA8 Dataset

Inleiding

Ultralytics DOTA8 is een kleine, maar veelzijdige dataset voor objectdetectie die bestaat uit de eerste 8 afbeeldingen van de gesplitste DOTAv1 set, 4 voor training en 4 voor validatie. Deze dataset is ideaal voor het testen en debuggen van objectdetectiemodellen of voor het experimenteren met nieuwe detectiebenaderingen. Met 8 afbeeldingen is het klein genoeg om gemakkelijk te beheren, maar toch divers genoeg om trainingslijnen te testen op fouten en te fungeren als een sanity check voordat grotere datasets worden getraind.

Deze dataset is bedoeld voor gebruik met Ultralytics HUB en YOLOv8.

Dataset YAML

Een YAML (Yet Another Markup Language) bestand wordt gebruikt om de configuratie van de dataset te definiëren. Het bevat informatie over de paden, klassen en andere relevante informatie van de dataset. In het geval van de DOTA8 dataset is de dota8.yaml bestand wordt onderhouden op https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/yolov5/releases/download/v1.0/dota8.zip

Gebruik

Om een YOLOv8n-obb model te trainen op de DOTA8 dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-obb.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='dota8.yaml', epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Voorbeeldafbeeldingen en -annotaties

Hier zijn enkele voorbeelden van afbeeldingen uit de DOTA8 dataset, samen met de bijbehorende annotaties:

Voorbeeldafbeelding dataset

Gemozaïekte afbeelding: Deze afbeelding toont een trainingsbatch die bestaat uit gemozaïekte afbeeldingen van de dataset. Mozaïeken is een techniek die tijdens het trainen wordt gebruikt om meerdere afbeeldingen te combineren tot één afbeelding om de verscheidenheid aan objecten en scènes binnen elke trainingsbatch te vergroten. Dit helpt het vermogen van het model om te generaliseren naar verschillende objectgroottes, beeldverhoudingen en contexten te verbeteren.

Het voorbeeld toont de verscheidenheid en complexiteit van de afbeeldingen in de DOTA8 dataset en de voordelen van het gebruik van mozaïek tijdens het trainingsproces.

Citaten en erkenningen

Als je de DOTA dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende document:

BibTeX

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Een speciaal woord van dank aan het team achter de DOTA datasets voor hun prijzenswaardige inzet bij het samenstellen van deze dataset. Ga voor een volledig begrip van de dataset en de nuances naar de officiële DOTA website.

Gemaakt op 2024-01-09, Bijgewerkt op 2024-01-09
Auteurs: Lachen-q (1)