DOTA8-Datensatz

Einführung

Ultralytics DOTA8 ist ein kleiner, aber vielseitiger orientierter Objekterkennungsdatensatz, der aus den ersten 8 Bildern des geteilten DOTAv1-Satzes besteht, 4 für das Training und 4 für die Validierung. Dieser Datensatz ist ideal zum Testen und Debuggen von Objekterkennungsmodellen oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 8 Bildern ist er klein genug, um leicht verwaltet werden zu können, und doch vielfältig genug, um die Trainings-Pipelines auf Fehler zu testen und vor dem Training größerer Datensätze als Sanity-Check zu dienen.

Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird zur Definition der Datensatzkonfiguration verwendet. Sie enthält Informationen über die Pfade des Datensatzes, Klassen und andere relevante Informationen. Im Falle des DOTA8-Datensatzes ist die Datei dota8.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Verwendung

Um ein YOLO11n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Beispielbilder und -kommentare

Hier sind einige Beispiele von Bildern aus dem DOTA8-Datensatz mit den entsprechenden Anmerkungen:

Datensatz Beispielbild

Mosaikbild: Dieses Bild zeigt einen Trainingsstapel, der aus Mosaikbildern des Datensatzes besteht. Das Mosaikieren ist eine Technik, bei der während des Trainings mehrere Bilder zu einem einzigen Bild kombiniert werden, um die Vielfalt der Objekte und Szenen in jedem Trainingsstapel zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zur Generalisierung auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu verbessern.

Das Beispiel verdeutlicht die Vielfalt und Komplexität der Bilder im DOTA8-Datensatz und die Vorteile der Mosaikbildung während des Trainingsprozesses.

Zitate und Danksagungen

Wenn Sie den DOTA-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Papier:

BibTeX

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Ein besonderer Dank gilt dem Team, das hinter den DOTA-Datensätzen steht, für seine lobenswerten Bemühungen bei der Zusammenstellung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Feinheiten besuchen Sie bitte die offizielle DOTA-Website.

FAQ

Was ist der DOTA8-Datensatz und wie kann er verwendet werden?

Der DOTA8-Datensatz ist ein kleiner, vielseitig orientierter Objekterkennungsdatensatz, der aus den ersten 8 Bildern des DOTAv1-Splitsatzes besteht, wobei 4 Bilder für das Training und 4 für die Validierung bestimmt sind. Er ist ideal zum Testen und Debuggen von Objekterkennungsmodellen wie Ultralytics YOLO11 . Aufgrund seiner überschaubaren Größe und Vielfalt hilft es bei der Identifizierung von Pipeline-Fehlern und der Durchführung von Plausibilitätsprüfungen, bevor größere Datensätze eingesetzt werden. Erfahren Sie mehr über Objekterkennung mit Ultralytics YOLO11.

Wie trainiere ich ein YOLO11 Modell mit dem DOTA8-Datensatz?

Um ein YOLO11n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Umfassende Argumentoptionen finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Was sind die wichtigsten Merkmale des DOTA-Datensatzes und wo kann ich auf die YAML-Datei zugreifen?

Der DOTA-Datensatz ist bekannt für seine groß angelegten Benchmarks und die damit verbundenen Herausforderungen für die Objekterkennung in Luftbildern. Der DOTA8-Teilsatz ist ein kleinerer, überschaubarer Datensatz, der sich ideal für erste Tests eignet. Sie können auf den dota8.yaml Datei, die Pfade, Klassen und Konfigurationsdetails enthält, an dieser GitHub-Link.

Wie verbessert die Mosaikbildung das Modelltraining mit dem DOTA8-Datensatz?

Beim Mosaicing werden mehrere Bilder während des Trainings zu einem einzigen Bild kombiniert, wodurch die Vielfalt der Objekte und Kontexte in jedem Stapel erhöht wird. Dies verbessert die Fähigkeit eines Modells, auf verschiedene Objektgrößen, Seitenverhältnisse und Szenen zu verallgemeinern. Diese Technik lässt sich anhand eines Trainingsstapels aus Mosaikbildern des DOTA8-Datensatzes visuell veranschaulichen und hilft bei der Entwicklung robuster Modelle. Erfahren Sie mehr über Mosaikbildung und Trainingstechniken auf unserer Trainingsseite.

Warum sollte ich Ultralytics YOLO11 für Objekterkennungsaufgaben verwenden?

Ultralytics YOLO11 bietet modernste Objekterkennungsfunktionen in Echtzeit, einschließlich Funktionen wie orientierte Bounding Boxes (OBB), Instanzsegmentierung und eine äußerst vielseitige Trainingspipeline. Sie ist für verschiedene Anwendungen geeignet und bietet vortrainierte Modelle für eine effiziente Feinabstimmung. Weitere Informationen zu den Vorteilen und der Verwendung finden Sie in der DokumentationUltralytics YOLO11 .

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 1 Monat