Passer au contenu

Ensemble de données DOTA8

Introduction

Ultralytics DOTA8 est un petit mais polyvalent jeu de données de détection d'objets orientés, composé des 8 premières images de l'ensemble DOTAv1 divisé, 4 pour l'entraînement et 4 pour la validation. Ce jeu de données est idéal pour tester et déboguer des modèles de détection d'objets, ou pour expérimenter de nouvelles approches de détection. Avec 8 images, il est suffisamment petit pour être facilement gérable, mais suffisamment diversifié pour tester les pipelines d'entraînement à la recherche d'erreurs et servir de contrôle de cohérence avant d'entraîner des jeux de données plus volumineux.

Ce jeu de données est destiné à être utilisé avec HUB Ultralytics et YOLO11.

YAML du jeu de données

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration de l'ensemble de données. Il contient des informations sur les chemins d'accès, les classes et d'autres informations pertinentes de l'ensemble de données. Dans le cas de l'ensemble de données DOTA8, le dota8.yaml fichier est maintenu à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilisation

Pour entraîner un modèle YOLO11n-obb sur le jeu de données DOTA8 pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Images et annotations d'exemple

Voici quelques exemples d'images du jeu de données DOTA8, ainsi que leurs annotations correspondantes :

Exemple d'image de l'ensemble de données

  • Image mosaïque : Cette image montre un lot d'entraînement composé d'images d'ensemble de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes dans chaque lot d'entraînement. Cela permet d'améliorer la capacité du modèle à se généraliser à différentes tailles d'objets, rapports hauteur/largeur et contextes.

Cet exemple illustre la variété et la complexité des images dans l'ensemble de données DOTA8, ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.

Citations et remerciements

Si vous utilisez l'ensemble de données DOTA dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Une note spéciale de gratitude à l'équipe derrière les ensembles de données DOTA pour leurs efforts louables dans la conservation de cet ensemble de données. Pour une compréhension exhaustive de l'ensemble de données et de ses nuances, veuillez visiter le site Web officiel de DOTA.

FAQ

Qu'est-ce que le jeu de données DOTA8 et comment peut-il être utilisé ?

L'ensemble de données DOTA8 est un petit ensemble de données polyvalent de détection d'objets orientés, composé des 8 premières images de l'ensemble de division DOTAv1, avec 4 images désignées pour l'entraînement et 4 pour la validation. Il est idéal pour tester et déboguer des modèles de détection d'objets tels que Ultralytics YOLO11. En raison de sa taille et de sa diversité gérables, il permet d'identifier les erreurs de pipeline et d'exécuter des contrôles de cohérence avant de déployer des ensembles de données plus volumineux. Apprenez-en davantage sur la détection d'objets avec Ultralytics YOLO11.

Comment entraîner un modèle YOLO11 en utilisant le jeu de données DOTA8 ?

Pour entraîner un modèle YOLO11n-obb sur le jeu de données DOTA8 pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour connaître les options d'arguments complètes, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Quelles sont les principales caractéristiques du jeu de données DOTA et où puis-je accéder au fichier YAML ?

L'ensemble de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il pose pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA8 est un ensemble de données plus petit et plus facile à gérer, idéal pour les tests initiaux. Vous pouvez accéder au dota8.yaml fichier, qui contient les chemins d'accès, les classes et les détails de configuration, à ce Lien GitHub.

Comment le mosaïquage améliore-t-il l'entraînement du modèle avec l'ensemble de données DOTA8 ?

La mosaïque combine plusieurs images en une seule pendant l'entraînement, ce qui augmente la variété des objets et des contextes dans chaque lot. Cela améliore la capacité d'un modèle à se généraliser à différentes tailles d'objets, rapports d'aspect et scènes. Cette technique peut être démontrée visuellement par un lot d'entraînement composé d'images de l'ensemble de données DOTA8 en mosaïque, ce qui contribue au développement d'un modèle robuste. Pour en savoir plus sur la mosaïque et les techniques d'entraînement, consultez notre page Entraînement.

Pourquoi devrais-je utiliser Ultralytics YOLO11 pour les tâches de détection d'objets ?

Ultralytics YOLO11 offre des capacités de détection d'objets en temps réel de pointe, y compris des fonctionnalités telles que les boîtes englobantes orientées (OBB), la segmentation d'instance et un pipeline d'entraînement très polyvalent. Il convient à diverses applications et offre des modèles pré-entraînés pour un réglage fin efficace. Explorez davantage les avantages et l'utilisation dans la documentation d'Ultralytics YOLO11.



📅 Créé il y a 1 an ✏️ Mis à jour il y a 5 mois

Commentaires