DOTA128 Dataset
Einführung
Ultralytics DOTA128 ist ein kleiner, aber vielseitiger orientierter Objekterkennungs- Datensatz bestehend aus 128 Bildern aus dem DOTAv1-Set, 128 für Training und Validierung. Dieser Datensatz ist ideal zum Testen und Debuggen von Modellen mit orientierten Bounding Boxes (OBB) oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 128 Bildern ist er klein genug, um einfach verwaltet zu werden, aber vielfältig genug, um Trainingspipelines auf Fehler zu prüfen und als Plausibilitätsprüfung vor dem Training größerer Datensätze zu dienen.
Datensatzstruktur
- Bilder: 128 Luftbilder (alle im train-Ordner, verwendet für train und val), stammen aus DOTAv1.
- Klassen: Erbt die 15 Kategorien von DOTAv1, wie Flugzeug, Schiff und großes Fahrzeug.
- Labels: Orientierte Bounding Boxes im YOLO-Format, gespeichert als
.txtDateien neben jedem Bild.
Dieser Datensatz ist für die Verwendung mit Ultralytics Platform und Fortschritten im Bereich YOLO26.
Datensatz-YAML
Eine YAML (Yet Another Markup Language)-Datei wird verwendet, um die Dataset-Konfiguration zu definieren. Sie enthält Informationen über die Pfade des Datensatzes, Klassen und andere relevante Informationen. Im Fall des DOTA128-Datensatzes ist die dota128.yaml Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipNutzung
Um ein YOLO26n-obb Modell auf dem DOTA128 Datensatz für 100 epochs bei einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du im Modell Training Seite.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Beispielbilder und Annotationen
Hier sind einige Beispiele für Bilder aus dem DOTA128 Datensatz, zusammen mit ihren entsprechenden Annotationen:
- Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatzbildern zusammengesetzt ist. Mosaicing ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies hilft, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im DOTA128 Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.
Zitate und Danksagungen
Wenn du den DOTA Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Ein besonderer Dank gilt dem Team hinter den DOTA Datensätzen für ihren lobenswerten Einsatz bei der Kuratierung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Nuancen besuche bitte die offizielle DOTA-Website.
FAQ
Was ist der DOTA128 Datensatz und wie kann er verwendet werden?
Der DOTA128 Datensatz ist ein vielseitiger Datensatz für orientierte Objekterkennung, der aus 128 Bildern des DOTAv1-Sets besteht, die alle im train-Ordner gespeichert sind. Sowohl Training als auch Validierung verwenden denselben Satz von Bildern, was ihn ideal für schnelle Test- und Debugging-Workflows macht. Er ist ideal zum Testen und Debuggen von OBB-Modellen wie Ultralytics YOLO26. Aufgrund seiner handlichen Größe und Vielfalt hilft er dabei, Pipeline-Fehler zu identifizieren und Plausibilitätsprüfungen durchzuführen, bevor größere Datensätze bereitgestellt werden. Erfahre mehr über OBB-Erkennung mit Ultralytics YOLO26.
Wie trainiere ich ein YOLO26 Modell mit dem DOTA128 Datensatz?
Um ein YOLO26n-obb Modell auf dem DOTA128 Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Schnipsel verwenden. Für umfassende Argument-Optionen beziehe dich auf die Modell Training Seite.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Was sind die Hauptmerkmale des DOTA Datensatzes und wo finde ich die YAML-Datei?
Der DOTA Datensatz ist bekannt für seinen groß angelegten Benchmark und die Herausforderungen, die er für die Objekterkennung in Luftbildern bietet. Das DOTA128-Subset bietet mehr Vielfalt als DOTA8, bleibt aber für erste Tests handhabbar. Du kannst auf die dota128.yaml Datei, die Pfade, Klassen und Konfigurationsdetails enthält, unter diesem GitHub-Link.
Wie schneidet DOTA128 im Vergleich zu anderen DOTA Datensatz-Varianten ab?
DOTA128 (128 Bilder) liegt größenmäßig zwischen DOTA8 (8 Bilder) und dem vollständigen DOTA-v1 Datensatz (1.869 Bilder):
- DOTA8: Enthält nur 8 Bilder (4 train, 4 val) - ideal für schnelle Tests und Debugging
- DOTA128: Enthält 128 Bilder (alle im train-Ordner, verwendet für train und val) - ausgewogen zwischen Größe und Vielfalt
- Full DOTA-v1: Enthält 1.869 Bilder - umfassend, aber ressourcenintensiv
DOTA128 bietet einen guten Mittelweg, der mehr Vielfalt als DOTA8 bietet, während er für Experimente und die erste Modellentwicklung viel besser handhabbar bleibt als der vollständige DOTA-Datensatz.
Wie verbessert Mosaicing das Modelltraining mit dem DOTA128 Datensatz?
Mosaicing kombiniert während des Trainings mehrere Bilder zu einem, was die Vielfalt der Objekte und Kontexte innerhalb jedes Batches erhöht. Dies verbessert die Fähigkeit eines Modells, auf verschiedene Objektgrößen, Seitenverhältnisse und Szenen zu verallgemeinern. Diese Technik lässt sich visuell durch einen Trainings-Batch demonstrieren, der aus mosaikierten DOTA128 Datensatzbildern besteht, was bei der Entwicklung robuster Modelle hilft. Erfahre mehr über Mosaicing und Trainingstechniken auf unserer Training Seite.
Warum sollte ich Ultralytics YOLO26 für Aufgaben der orientierten Objekterkennung verwenden?
Ultralytics YOLO26 bietet modernste Echtzeit-Objekterkennungsfunktionen, einschließlich Features wie orientierte Bounding Boxes (OBB), Instanzsegmentierung, und eine äußerst vielseitige Trainingspipeline. Es ist für verschiedene Anwendungen geeignet und bietet vortrainierte Modelle für ein effizientes Fine-Tuning. Erfahre mehr über die Vorteile und die Verwendung in der Ultralytics YOLO26 Dokumentation.