DOTA8 Datensatz
Einführung
Ultralytics DOTA8 ist ein kleiner, aber vielseitiger Datensatz zur orientierten Objekterkennung, der aus den ersten 8 Bildern des aufgeteilten DOTAv1-Sets besteht, davon 4 für das Training und 4 für die Validierung. Dieser Datensatz ist ideal zum Testen und Debuggen von Objekterkennungsmodellen oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 8 Bildern ist er klein genug, um leicht handhabbar zu sein, aber dennoch vielfältig genug, um Trainings-Pipelines auf Fehler zu prüfen und als Plausibilitätsprüfung vor dem Training mit größeren Datensätzen zu dienen.
Datensatzstruktur
-
Bilder: 8 Luftbild-Kacheln (4 Train, 4 Val) aus DOTAv1.
-
Klassen: Erbt die 15 DOTAv1-Kategorien wie Flugzeug, Schiff und großes Fahrzeug.
-
Labels: Im YOLO-Format orientierte Begrenzungsrahmen, die als
.txt-Dateien neben jedem Bild gespeichert sind. -
Empfohlenes Layout:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Dieser Datensatz ist für die Verwendung mit der Ultralytics Platform und YOLO26 vorgesehen.
Datensatz-YAML
Eine YAML (Yet Another Markup Language) Datei wird verwendet, um die Datensatzkonfiguration zu definieren. Sie enthält Informationen über die Pfade, Klassen und andere relevante Daten des Datensatzes. Im Fall des DOTA8-Datensatzes wird die dota8.yaml Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml gepflegt.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zipVerwendung
Um ein YOLO26n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Training des Modells.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Beispielbilder und Annotationen
Hier sind einige Beispiele für Bilder aus dem DOTA8-Datensatz zusammen mit den entsprechenden Annotationen:
- Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatzbildern besteht. Mosaiking ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im DOTA8-Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.
Zitate und Danksagungen
Wenn du den DOTA-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Papier:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Ein besonderer Dank gilt dem Team hinter den DOTA-Datensätzen für ihre lobenswerte Arbeit bei der Kuratierung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Nuancen besuche bitte die offizielle DOTA-Website.
FAQ
Was ist der DOTA8-Datensatz und wie kann er verwendet werden?
Der DOTA8-Datensatz ist ein kleiner, vielseitiger Datensatz zur orientierten Objekterkennung, der aus den ersten 8 Bildern des aufgeteilten DOTAv1-Sets besteht, wobei 4 Bilder für das Training und 4 für die Validierung vorgesehen sind. Er ist ideal zum Testen und Debuggen von Objekterkennungsmodellen wie Ultralytics YOLO26. Aufgrund seiner handlichen Größe und Vielfalt hilft er dabei, Pipeline-Fehler zu identifizieren und Plausibilitätsprüfungen durchzuführen, bevor größere Datensätze eingesetzt werden. Erfahre mehr über Objekterkennung mit Ultralytics YOLO26.
Wie trainiere ich ein YOLO26-Modell mit dem DOTA8-Datensatz?
Um ein YOLO26n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Für umfassende Argument-Optionen beziehe dich auf die Seite Training des Modells.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Was sind die Hauptmerkmale des DOTA-Datensatzes und wo kann ich auf die YAML-Datei zugreifen?
Der DOTA-Datensatz ist bekannt für seinen groß angelegten Benchmark und die Herausforderungen, die er bei der Objekterkennung in Luftbildern darstellt. Das DOTA8-Subset ist ein kleinerer, handlicher Datensatz, der ideal für erste Tests ist. Du kannst auf die dota8.yaml Datei, die Pfade, Klassen und Konfigurationsdetails enthält, über diesen GitHub-Link zugreifen.
Wie verbessert Mosaicing das Modelltraining mit dem DOTA8-Datensatz?
Mosaicing kombiniert während des Trainings mehrere Bilder zu einem einzigen, was die Vielfalt der Objekte und Kontexte innerhalb jedes Batches erhöht. Dies verbessert die Fähigkeit eines Modells, auf verschiedene Objektgrößen, Seitenverhältnisse und Szenen zu verallgemeinern. Diese Technik lässt sich visuell anhand eines Trainingsbatches demonstrieren, der aus mosaizierten Bildern des DOTA8-Datensatzes besteht, und hilft bei der robusten Modellentwicklung. Erfahre mehr über Mosaicing und Trainingstechniken auf unserer Training Seite.
Warum sollte ich Ultralytics YOLO26 für Objekterkennungsaufgaben verwenden?
Ultralytics YOLO26 bietet modernste Echtzeit-Objekterkennungsfunktionen, einschließlich Features wie orientierte Begrenzungsrahmen (OBB), Instanzsegmentierung und eine äußerst vielseitige Trainings-Pipeline. Es ist für verschiedene Anwendungen geeignet und bietet vortrainierte Modelle für ein effizientes Finetuning. Entdecke mehr über die Vorteile und die Nutzung in der Ultralytics YOLO26 Dokumentation.