Overslaan naar inhoud

DOTA8 Dataset

Inleiding

Ultralytics DOTA8 is een kleine, maar veelzijdige dataset voor objectdetectie die bestaat uit de eerste 8 afbeeldingen van de gesplitste DOTAv1 set, 4 voor training en 4 voor validatie. Deze dataset is ideaal voor het testen en debuggen van objectdetectiemodellen of voor het experimenteren met nieuwe detectiebenaderingen. Met 8 afbeeldingen is het klein genoeg om gemakkelijk te beheren, maar toch divers genoeg om trainingslijnen te testen op fouten en te fungeren als een sanity check voordat grotere datasets worden getraind.

Deze dataset is bedoeld voor gebruik met Ultralytics HUB en YOLOv8.

Dataset YAML

Een YAML (Yet Another Markup Language) bestand wordt gebruikt om de configuratie van de dataset te definiëren. Het bevat informatie over de paden, klassen en andere relevante informatie van de dataset. In het geval van de DOTA8 dataset is de dota8.yaml bestand wordt onderhouden op https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Gebruik

Om een YOLOv8n-obb model te trainen op de DOTA8 dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor een uitgebreide lijst met beschikbare argumenten.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Voorbeeldafbeeldingen en -annotaties

Hier zijn enkele voorbeelden van afbeeldingen uit de DOTA8 dataset, samen met de bijbehorende annotaties:

Voorbeeldafbeelding dataset

  • Gemozaïekte afbeelding: Deze afbeelding toont een trainingsbatch die bestaat uit gemozaïekte afbeeldingen van de dataset. Mozaïeken is een techniek die tijdens het trainen wordt gebruikt om meerdere afbeeldingen te combineren tot één afbeelding om de verscheidenheid aan objecten en scènes binnen elke trainingsbatch te vergroten. Dit helpt het vermogen van het model om te generaliseren naar verschillende objectgroottes, beeldverhoudingen en contexten te verbeteren.

Het voorbeeld toont de verscheidenheid en complexiteit van de afbeeldingen in de DOTA8 dataset en de voordelen van het gebruik van mozaïek tijdens het trainingsproces.

Citaten en erkenningen

Als je de DOTA dataset gebruikt in je onderzoek of ontwikkeling, citeer dan het volgende document:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Een speciaal woord van dank aan het team achter de DOTA datasets voor hun prijzenswaardige inzet bij het samenstellen van deze dataset. Ga voor een volledig begrip van de dataset en de nuances naar de officiële DOTA website.

FAQ

Wat is de DOTA8 dataset en hoe kan deze worden gebruikt?

De DOTA8 dataset is een kleine, veelzijdig georiënteerde objectdetectie dataset die bestaat uit de eerste 8 afbeeldingen van de DOTAv1 split set, met 4 afbeeldingen bestemd voor training en 4 voor validatie. Het is ideaal voor het testen en debuggen van objectdetectiemodellen zoals Ultralytics YOLOv8 . Door de hanteerbare grootte en diversiteit helpt het bij het identificeren van fouten in de pijplijn en het uitvoeren van sanity checks voordat grotere datasets worden ingezet. Meer informatie over objectdetectie met Ultralytics YOLOv8.

Hoe train ik een YOLOv8 model met de DOTA8 dataset?

Om een YOLOv8n-obb model te trainen op de DOTA8 dataset voor 100 epochs met een afbeeldingsgrootte van 640, kun je de volgende codefragmenten gebruiken. Raadpleeg de pagina Model Training voor uitgebreide argumentopties.

Voorbeeld trein

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Wat zijn de belangrijkste kenmerken van de DOTA dataset en waar kan ik het YAML-bestand openen?

De DOTA dataset staat bekend om zijn grootschalige benchmark en de uitdagingen die het biedt voor objectdetectie in luchtfoto's. De DOTA8 subset is een kleinere, hanteerbare dataset die ideaal is voor eerste tests. Je hebt toegang tot de dota8.yaml bestand, dat paden, klassen en configuratiedetails bevat, op dit GitHub link.

Hoe verbetert mosaicing de modeltraining met de DOTA8 dataset?

Mosaicing combineert meerdere beelden tot één beeld tijdens het trainen, waardoor de verscheidenheid aan objecten en contexten binnen elke batch toeneemt. Dit verbetert het vermogen van een model om te generaliseren naar verschillende objectgroottes, beeldverhoudingen en scènes. Deze techniek kan visueel worden gedemonstreerd aan de hand van een trainingsbatch bestaande uit gemozaïekte DOTA8 dataset afbeeldingen, wat helpt bij het ontwikkelen van robuuste modellen. Ontdek meer over mozaïeken en trainingstechnieken op onze pagina Training.

Waarom zou ik Ultralytics YOLOv8 gebruiken voor objectdetectietaken?

Ultralytics YOLOv8 biedt ultramoderne realtime objectdetectiemogelijkheden, waaronder functies als oriented bounding boxes (OBB), segmentatie van instanties en een zeer veelzijdige trainingspijplijn. Het is geschikt voor verschillende toepassingen en biedt voorgetrainde modellen voor efficiënte fijnafstelling. Lees meer over de voordelen en het gebruik in de Ultralytics YOLOv8 documentatie.



Aangemaakt 2024-01-09, Bijgewerkt 2024-07-04
Auteurs: glenn-jocher (3), Laughing-q (1)

Reacties