DOTA128-Datensatz
Einführung
Ultralytics DOTA128 ist ein kleiner, aber vielseitiger Datensatz zur Objekterkennung, der aus 128 Bildern aus dem DOTAv1-Set besteht, davon 128 für Training und Validierung. Dieser Datensatz eignet sich ideal zum Testen und Debuggen von OBB-Modellen (Oriented Bounding Box) oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 128 Bildern ist er klein genug, um leicht zu verwalten zu sein, aber dennoch vielfältig genug, um Trainingspipelines auf Fehler zu testen und als Plausibilitätsprüfung vor dem Training größerer Datensätze zu dienen.
Dataset-Struktur
- Bilder: 128 Luftbildkacheln (alle im Ordner „train“, werden sowohl für „train“ als auch für „val“ verwendet) stammen aus DOTAv1.
- Klassen: Erbt die 15 DOTAv1-Kategorien wie Flugzeug, Schiff und großes Fahrzeug.
- Beschriftungen: Im YOLO-Format orientierte Begrenzungsrahmen gespeichert als
.txtDateien neben jedem Bild.
Dieser Datensatz ist für die Verwendung mit Ultralytics Platform und YOLO26 vorgesehen.
Datensatz-YAML
Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Konfiguration des Datensatzes zu definieren. Sie enthält Informationen über die Pfade, Klassen und andere relevante Informationen des Datensatzes. Im Fall des DOTA128-Datensatzes ist die dota128.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip
Nutzung
Um einobb auf dem DOTA128-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeausschnitte verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
sample_images und Anmerkungen
Hier sind einige Beispiele für Bilder aus dem DOTA128-Datensatz zusammen mit den entsprechenden Anmerkungen:

- Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus Mosaik-Datensatzbildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird und mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batch zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.
Das Beispiel verdeutlicht die Vielfalt und Komplexität der Bilder im DOTA128-Datensatz und die Vorteile der Verwendung von Mosaikbildung während des Trainingsprozesses.
Zitate und Danksagungen
Wenn Sie den DOTA-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Ein besonderer Dank gilt dem Team hinter den DOTA-Datensätzen für ihre lobenswerte Arbeit bei der Kuratierung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Nuancen besuchen Sie bitte die offizielle DOTA-Website.
FAQ
Was ist der DOTA128-Datensatz und wie kann er verwendet werden?
Der DOTA128-Datensatz ist ein vielseitiger Datensatz zur Objekterkennung, der aus 128 Bildern aus dem DOTAv1-Set besteht, die alle im Ordner „train“ gespeichert sind. Sowohl für das Training als auch für die Validierung wird derselbe Bildsatz verwendet, wodurch er sich ideal für schnelle Tests und Debugging-Workflows eignet. Er eignet sich ideal zum Testen und Debuggen von OBB-Modellen wie Ultralytics . Aufgrund seiner überschaubaren Größe und Vielfalt hilft er dabei, Pipeline-Fehler zu identifizieren und Sanity Checks durchzuführen, bevor größere Datensätze bereitgestellt werden. Erfahren Sie mehr über die OBB-Erkennung mit Ultralytics .
Wie trainiere ich ein YOLO26-Modell mit dem DOTA128-Datensatz?
Um einobb auf dem DOTA128-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeausschnitte verwenden. Umfassende Informationen zu den Argumentoptionen finden Sie auf der Seite Modelltraining.
Trainingsbeispiel
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Was sind die wichtigsten Merkmale des DOTA-Datensatzes und wo kann ich auf die YAML-Datei zugreifen?
Der DOTA-Datensatz ist bekannt für seinen groß angelegten Benchmark und die Herausforderungen, die er für die Objekterkennung in Luftbildern darstellt. Die Teilmenge DOTA128 bietet mehr Vielfalt als DOTA8 und bleibt dennoch für erste Tests überschaubar. Sie können auf die dota128.yaml Datei, die Pfade, Klassen und Konfigurationsdetails enthält, an dieser GitHub Link.
Wie schneidet DOTA128 im Vergleich zu anderen DOTA-Datensatzvarianten ab?
DOTA128 (128 Bilder) liegt hinsichtlich seiner Größe zwischen DOTA8 (8 Bilder) und dem vollständigen DOTA-v1-Datensatz (1.869 Bilder):
- DOTA8: Enthält nur 8 Bilder (4 Zug, 4 Val) – ideal für schnelle Tests und Debugging
- DOTA128: Enthält 128 Bilder (alle im Ordner „train“, werden sowohl für „train“ als auch für „val“ verwendet) – ausgewogenes Verhältnis zwischen Größe und Vielfalt
- Vollständige DOTA-v1: Enthält 1.869 Bilder – umfassend, aber ressourcenintensiv
DOTA128 bietet einen guten Mittelweg, da es mehr Vielfalt als DOTA8 bietet und gleichzeitig für Experimente und die anfängliche Modellentwicklung viel übersichtlicher ist als der vollständige DOTA-Datensatz.
Wie verbessert Mosaicing das Modelltraining mit dem DOTA128-Datensatz?
Beim Mosaicing werden während des Trainings mehrere Bilder zu einem einzigen Bild zusammengefügt, wodurch die Vielfalt der Objekte und Kontexte innerhalb jedes Batches erhöht wird. Dies verbessert die Fähigkeit eines Modells, auf unterschiedliche Objektgrößen, Seitenverhältnisse und Szenen zu generalisieren. Diese Technik lässt sich anhand eines Trainingsbatches veranschaulichen, der aus mosaikartigen DOTA128-Datensatzbildern besteht und zur Entwicklung robuster Modelle beiträgt. Weitere Informationen zu Mosaicing und Trainingstechniken finden Sie auf unserer Trainingsseite.
Warum sollte ich Ultralytics für Aufgaben zur objektorientierten Erkennung verwenden?
Ultralytics YOLO26 bietet hochmoderne Echtzeit-Objekterkennungsfunktionen, einschließlich Features wie orientierte Bounding Boxes (OBB), Instanzsegmentierung und eine äußerst vielseitige Trainingspipeline. Es eignet sich für verschiedene Anwendungen und bietet vortrainierte Modelle für ein effizientes Fine-Tuning. Erfahren Sie mehr über die Vorteile und die Nutzung in der Ultralytics YOLO26 Dokumentation.