Ensemble de données DOTA8

Introduction

Ultralytics DOTA8 est un ensemble de données de détection d'objets, petit mais polyvalent, composé des 8 premières images de l'ensemble DOTAv1, 4 pour l'entraînement et 4 pour la validation. Ce jeu de données est idéal pour tester et déboguer les modèles de détection d'objets, ou pour expérimenter de nouvelles approches de détection. Avec 8 images, il est suffisamment petit pour être facilement gérable, tout en étant suffisamment diversifié pour tester les pipelines d'entraînement et agir comme un contrôle d'assainissement avant d'entraîner des ensembles de données plus importants.

Ce jeu de données est destiné à être utilisé avec Ultralytics HUB et YOLO11.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données DOTA8, le fichier dota8.yaml est conservé à l'adresse suivante https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilisation

Pour entraîner un modèle YOLO11n-obb sur l'ensemble de données DOTA8 pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, reportez-vous à la page Entraînement du modèle.

Exemple de train

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données DOTA8, ainsi que les annotations correspondantes :

Image de l'échantillon de l'ensemble de données

Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant l'apprentissage qui combine plusieurs images en une seule afin d'augmenter la variété des objets et des scènes dans chaque lot d'apprentissage. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

Cet exemple illustre la variété et la complexité des images de l'ensemble de données DOTA8 et les avantages de l'utilisation du mosaïquage au cours du processus d'apprentissage.

Citations et remerciements

Si vous utilisez l'ensemble de données DOTA dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

BibTeX

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Nous tenons à remercier tout particulièrement l'équipe responsable des ensembles de données DOTA pour les efforts louables qu'elle a déployés afin de conserver cet ensemble de données. Pour une compréhension exhaustive de l'ensemble de données et de ses nuances, veuillez consulter le site officiel de DOTA.

FAQ

Qu'est-ce que l'ensemble de données DOTA8 et comment peut-on l'utiliser ?

L'ensemble de données DOTA8 est un petit ensemble de données polyvalent de détection d'objets composé des 8 premières images de l'ensemble divisé DOTAv1, avec 4 images désignées pour l'entraînement et 4 pour la validation. Il est idéal pour tester et déboguer des modèles de détection d'objets tels que Ultralytics YOLO11 . En raison de sa taille et de sa diversité gérables, il permet d'identifier les erreurs de pipeline et d'effectuer des vérifications avant de déployer des ensembles de données plus importants. En savoir plus sur la détection d'objets avec Ultralytics YOLO11.

Comment entraîner un modèle YOLO11 en utilisant le jeu de données DOTA8 ?

Pour entraîner un modèle YOLO11n-obb sur l'ensemble de données DOTA8 pour 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour plus d'informations sur les options d'argument, reportez-vous à la page Entraînement du modèle.

Exemple de train

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Quelles sont les principales caractéristiques de l'ensemble de données DOTA et où puis-je accéder au fichier YAML ?

L'ensemble de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il présente pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA8 est un ensemble de données plus petit et plus facile à gérer, idéal pour les premiers tests. Vous pouvez accéder à l'ensemble de données dota8.yaml qui contient les chemins d'accès, les classes et les détails de la configuration. Lien GitHub.

Comment le mosaïquage améliore-t-il l'apprentissage des modèles avec l'ensemble de données DOTA8 ?

La mosaïque combine plusieurs images en une seule pendant l'entraînement, ce qui augmente la variété des objets et des contextes dans chaque lot. Cela améliore la capacité d'un modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différentes scènes. Cette technique peut être démontrée visuellement par un lot d'entraînement composé d'images mosaïquées de l'ensemble de données DOTA8, ce qui contribue au développement de modèles robustes. Pour en savoir plus sur les mosaïques et les techniques de formation, consultez notre page Formation.

Pourquoi utiliser Ultralytics YOLO11 pour la détection d'objets ?

Ultralytics YOLO11 offre des capacités de pointe en matière de détection d'objets en temps réel, notamment des fonctions telles que les boîtes de délimitation orientées (OBB), la segmentation des instances et un pipeline d'apprentissage très polyvalent. Il convient à diverses applications et propose des modèles pré-entraînés pour une mise au point efficace. Pour en savoir plus sur les avantages et l'utilisation de ce logiciel, consultez la documentation deUltralytics YOLO11 .

📅C réé il y a 1 an ✏️ Mis à jour il y a 1 mois