DOTA128-Datensatz#

Name: DOTA128 OBB Datensatz
Creator: Ultralytics
License: https://captain-whu.github.io/DOTA/dataset.html
Keywords: DOTA128-Datensatz, Ultralytics, YOLO26, Objekterkennung, Debugging, Modelle trainieren, orientierte Objekterkennung, Datensatz-YAML

Einführung#

Ultralytics DOTA128 ist ein kleiner, aber vielseitiger Datensatz für orientierte Objekterkennung, der aus 128 Bildern aus dem DOTAv1-Satz besteht – 128 für Training und Validierung. Dieser Datensatz ist ideal zum Testen und Debuggen von Modellen mit orientierten Bounding Boxes (OBB) oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 128 Bildern ist er klein genug, um einfach verwaltbar zu sein, bietet aber genug Diversität, um Trainings-Pipelines auf Fehler zu prüfen und als Plausibilitätsprüfung vor dem Training mit größeren Datensätzen zu dienen.

Datensatzstruktur#

Bilder: 128 Luftbild-Kacheln (alle im Train-Ordner, verwendet für Training und Validierung), bezogen aus DOTAv1.
Klassen: Erbt die 15 DOTAv1-Kategorien wie Flugzeug, Schiff und großes Fahrzeug.
Labels: Orientierte Begrenzungsrahmen im YOLO-Format, die als .txt-Dateien neben jedem Bild gespeichert sind.
Download: 34 MB, wird beim ersten Training automatisch von den Ultralytics GitHub-Assets abgerufen.

Dieser Datensatz ist für die Verwendung mit der Ultralytics Platform und YOLO26 konzipiert.

Datensatz-YAML#

Eine YAML-Datei wird verwendet, um die Dataset-Konfiguration zu definieren. Sie enthält Informationen über die Pfade, Klassen und andere relevante Daten des Datasets. Im Fall des DOTA128 Datasets wird die dota128.yaml Datei unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml gepflegt.

ultralytics/cfg/datasets/dota128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Verwendung#

Um ein YOLO26n-obb-Modell auf dem DOTA128-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente findest du auf der Seite Training für Modelle.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Beispielbilder und Annotationen#

Hier sind einige Beispiele für Bilder aus dem DOTA128-Datensatz zusammen mit den entsprechenden Annotationen:

DOTA128 oriented bounding box dataset training mosaic

Mosaik-Bild: Dieses Bild zeigt einen Trainings-Batch, der aus mosaikierten Datensatz-Bildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird, um mehrere Bilder zu einem einzigen Bild zu kombinieren, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batches zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel zeigt die Vielfalt und Komplexität der Bilder im DOTA128-Datensatz sowie die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Zitate und Danksagungen#

Wenn du den DOTA-Datensatz in deiner Forschung oder Entwicklungsarbeit verwendest, zitiere bitte das folgende Paper:

Zitat

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2022},
  volume={44},
  number={11},
  pages={7778-7796},
  doi={10.1109/TPAMI.2021.3117983}
}

Ein besonderer Dank gilt dem Team hinter den DOTA-Datensätzen für ihre lobenswerten Bemühungen bei der Kuratierung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Nuancen besuche bitte die offizielle DOTA-Website.

FAQ#

Was ist der DOTA128-Datensatz und wie kann er verwendet werden?#

Der DOTA128-Datensatz ist ein vielseitiger Datensatz für orientierte Objekterkennung, bestehend aus 128 Bildern aus dem DOTAv1-Satz, die alle im Train-Ordner gespeichert sind. Sowohl das Training als auch die Validierung verwenden denselben Satz von Bildern, was ihn ideal für schnelle Test- und Debugging-Workflows macht. Er eignet sich hervorragend zum Testen und Debuggen von OBB-Modellen wie Ultralytics YOLO26. Aufgrund seiner überschaubaren Größe und Diversität hilft er dabei, Pipeline-Fehler zu identifizieren und Plausibilitätsprüfungen durchzuführen, bevor größere Datensätze eingesetzt werden. Erfahre mehr über OBB-Erkennung mit Ultralytics YOLO26.

Wie trainiere ich ein YOLO26-Modell mit dem DOTA128-Datensatz?#

Um ein YOLO26n-obb-Modell auf dem DOTA128-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, kannst du die folgenden Code-Snippets verwenden. Für umfassende Argument-Optionen beziehe dich bitte auf die Seite Training für Modelle.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Was sind die Hauptmerkmale des DOTA-Datensatzes und wo kann ich auf die YAML-Datei zugreifen?#

Der DOTA-Datensatz ist bekannt für sein groß angelegtes Benchmark und die Herausforderungen, die er für die Objekterkennung in Luftbildern darstellt. Der DOTA128-Teilsatz bietet mehr Diversität als DOTA8, bleibt dabei aber für erste Tests handhabbar. Du kannst auf die dota128.yaml-Datei, die Pfade, Klassen und Konfigurationsdetails enthält, über diesen GitHub-Link zugreifen.

Wie schneidet DOTA128 im Vergleich zu anderen DOTA-Datensatzvarianten ab?#

DOTA128 (128 Bilder) liegt größenmäßig zwischen DOTA8 (8 Bilder) und dem vollständigen DOTA-v1-Datensatz (1.869 Bilder):

DOTA8: Enthält nur 8 Bilder (4 Training, 4 Validierung) - ideal für schnelle Tests und Debugging
DOTA128: Enthält 128 Bilder (alle im Train-Ordner, verwendet für Training und Validierung) - ausgewogen zwischen Größe und Diversität
Vollständiges DOTA-v1: Enthält 1.869 Bilder - umfassend, aber ressourcenintensiv

DOTA128 bietet einen guten Mittelweg, da er mehr Diversität als DOTA8 bietet, während er für Experimente und die erste Modellentwicklung weitaus handhabbarer bleibt als der vollständige DOTA-Datensatz.

Wie verbessert Mosaicing das Modelltraining mit dem DOTA128-Datensatz?#

Mosaicing kombiniert während des Trainings mehrere Bilder zu einem, was die Vielfalt der Objekte und Kontexte innerhalb jeder Batch erhöht. Dies verbessert die Fähigkeit eines Modells, auf verschiedene Objektgrößen, Seitenverhältnisse und Szenen zu generalisieren. Diese Technik lässt sich visuell anhand einer Trainings-Batch demonstrieren, die aus mosaiced DOTA128-Datensatzbildern besteht, was bei der robusten Modellentwicklung hilft. Entdecke mehr über Mosaicing und Trainingstechniken auf unserer Training-Seite.

Warum sollte ich Ultralytics YOLO26 für Aufgaben der orientierten Objekterkennung verwenden?#

Ultralytics YOLO26 bietet hochmoderne Echtzeit-Objekterkennungsfunktionen, einschließlich Features wie orientierte Begrenzungsrahmen (OBB), Instanzsegmentierung und eine äußerst vielseitige Trainingspipeline. Es eignet sich für verschiedene Anwendungen und bietet vortrainierte Modelle für ein effizientes Fine-Tuning. Erfahre mehr über die Vorteile und die Verwendung in der Ultralytics YOLO26-Dokumentation.

Mitwirkende

GLglenn-jocher² RAraimbekovm² LALaughing-q¹

Erstellt vor 4 MonatenAktualisiert vor 2 Wochen