Zum Inhalt springen

DOTA8 Datensatz

Einführung

Ultralytics DOTA8 ist ein kleiner, aber vielseitiger, orientierter Objekterkennungs-Datensatz, der aus den ersten 8 Bildern des geteilten DOTAv1-Datensatzes besteht, 4 für das Training und 4 für die Validierung. Dieser Datensatz ist ideal zum Testen und Debuggen von Objekterkennungsmodellen oder zum Experimentieren mit neuen Erkennungsansätzen. Mit 8 Bildern ist er klein genug, um leicht verwaltet werden zu können, aber dennoch vielfältig genug, um Trainingspipelines auf Fehler zu testen und als Plausibilitätsprüfung vor dem Training größerer Datensätze zu dienen.

Dieser Datensatz ist für die Verwendung mit Ultralytics HUB und YOLO11 vorgesehen.

Datensatz-YAML

Eine YAML-Datei (Yet Another Markup Language) wird verwendet, um die Konfiguration des Datensatzes zu definieren. Sie enthält Informationen über die Pfade, Klassen und andere relevante Informationen des Datensatzes. Im Fall des DOTA8-Datensatzes ist die dota8.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Nutzung

Um ein YOLO11n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

sample_images und Anmerkungen

Hier sind einige Beispiele für Bilder aus dem DOTA8-Datensatz zusammen mit den dazugehörigen Anmerkungen:

Beispielbild des Datensatzes

  • Mosaikbild: Dieses Bild zeigt einen Trainings-Batch, der aus Mosaik-Datensatzbildern besteht. Mosaicing ist eine Technik, die während des Trainings verwendet wird und mehrere Bilder zu einem einzigen Bild kombiniert, um die Vielfalt der Objekte und Szenen innerhalb jedes Trainings-Batch zu erhöhen. Dies trägt dazu bei, die Fähigkeit des Modells zu verbessern, auf verschiedene Objektgrößen, Seitenverhältnisse und Kontexte zu generalisieren.

Das Beispiel demonstriert die Vielfalt und Komplexität der Bilder im DOTA8-Datensatz und die Vorteile der Verwendung von Mosaicing während des Trainingsprozesses.

Zitate und Danksagungen

Wenn Sie den DOTA-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Paper:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Ein besonderer Dank gilt dem Team hinter den DOTA-Datensätzen für ihre lobenswerte Arbeit bei der Kuratierung dieses Datensatzes. Für ein umfassendes Verständnis des Datensatzes und seiner Nuancen besuchen Sie bitte die offizielle DOTA-Website.

FAQ

Was ist der DOTA8-Datensatz und wie kann er verwendet werden?

Das DOTA8-Dataset ist ein kleines, vielseitiges Dataset für die Erkennung von Objekten mit Ausrichtung, das aus den ersten 8 Bildern des DOTAv1-Split-Sets besteht, wobei 4 Bilder für das Training und 4 für die Validierung vorgesehen sind. Es ist ideal zum Testen und Debuggen von Objekterkennungsmodellen wie Ultralytics YOLO11. Aufgrund seiner überschaubaren Größe und Vielfalt hilft es bei der Identifizierung von Pipeline-Fehlern und der Durchführung von Plausibilitätsprüfungen vor dem Einsatz größerer Datasets. Erfahren Sie mehr über Objekterkennung mit Ultralytics YOLO11.

Wie trainiere ich ein YOLO11-Modell mit dem DOTA8 Datensatz?

Um ein YOLO11n-obb-Modell auf dem DOTA8-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Code-Snippets verwenden. Umfassende Argumentoptionen finden Sie auf der Trainings-Seite des Modells.

Trainingsbeispiel

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Was sind die wichtigsten Merkmale des DOTA-Datensatzes und wo kann ich auf die YAML-Datei zugreifen?

Das DOTA-Dataset ist bekannt für seinen groß angelegten Benchmark und die Herausforderungen, die es für die Objekterkennung in Luftbildern darstellt. Die DOTA8-Teilmenge ist ein kleineres, handhabbares Dataset, das sich ideal für erste Tests eignet. Sie können auf die dota8.yaml Datei, die Pfade, Klassen und Konfigurationsdetails enthält, an dieser GitHub Link.

Wie verbessert Mosaicing das Modelltraining mit dem DOTA8-Datensatz?

Mosaicing kombiniert während des Trainings mehrere Bilder zu einem, wodurch die Vielfalt der Objekte und Kontexte innerhalb jedes Batches erhöht wird. Dies verbessert die Fähigkeit eines Modells, auf verschiedene Objektgrößen, Seitenverhältnisse und Szenen zu generalisieren. Diese Technik kann visuell anhand eines Trainings-Batches demonstriert werden, der aus Mosaiced-DOTA8-Datensatzbildern besteht und zur robusten Modellentwicklung beiträgt. Erfahren Sie mehr über Mosaicing- und Trainingstechniken auf unserer Training-Seite.

Warum sollte ich Ultralytics YOLO11 für Objekterkennungsaufgaben verwenden?

Ultralytics YOLO11 bietet modernste Echtzeit-Objekterkennungsfunktionen, einschließlich Funktionen wie Oriented Bounding Boxes (OBB), Instanzsegmentierung und eine äußerst vielseitige Trainingspipeline. Es eignet sich für verschiedene Anwendungen und bietet vortrainierte Modelle für ein effizientes Fine-Tuning. Weitere Informationen zu den Vorteilen und der Verwendung finden Sie in der Ultralytics YOLO11 Dokumentation.



📅 Vor 1 Jahr erstellt ✏️ Vor 5 Monaten aktualisiert

Kommentare