Skip to content

Ensemble de données DOTA8

Introduction

Ultralytics DOTA8 est un ensemble de données de détection d'objets orienté, petit mais polyvalent, composé des 8 premières images de l'ensemble divisé DOTAv1, 4 pour l'entraînement et 4 pour la validation. Cet ensemble de données est idéal pour tester et déboguer les modèles de détection d'objets, ou pour expérimenter de nouvelles approches de détection. Avec 8 images, il est suffisamment petit pour être facilement gérable, tout en étant suffisamment diversifié pour tester les pipelines de formation à la recherche d'erreurs et servir de contrôle d'assainissement avant de former des ensembles de données plus importants.

Cet ensemble de données est destiné à être utilisé avec Ultralytics HUB et YOLOv8.

Jeu de données YAML

Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins d'accès au jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données DOTA8, le fichier YAML est un fichier de configuration. dota8.yaml est maintenu à https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilisation

Pour entraîner un modèle YOLOv8n-obb sur l'ensemble de données DOTA8 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour obtenir une liste complète des arguments disponibles, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Exemples d'images et d'annotations

Voici quelques exemples d'images tirées de l'ensemble de données DOTA8, ainsi que les annotations correspondantes :

Image de l'échantillon du jeu de données

  • Image mosaïque: Cette image montre un lot d'entraînement composé d'images de données mosaïquées. La mosaïque est une technique utilisée pendant la formation qui combine plusieurs images en une seule afin d'augmenter la variété d'objets et de scènes dans chaque lot de formation. Cela permet d'améliorer la capacité du modèle à s'adapter à différentes tailles d'objets, à différents rapports d'aspect et à différents contextes.

L'exemple montre la variété et la complexité des images de l'ensemble de données DOTA8 et les avantages de l'utilisation du mosaïquage pendant le processus de formation.

Citations et remerciements

Si tu utilises l'ensemble de données DOTA dans tes travaux de recherche ou de développement, cite l'article suivant :

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Une note spéciale de gratitude à l'équipe derrière les ensembles de données DOTA pour leurs efforts louables dans la conservation de cet ensemble de données. Pour une compréhension exhaustive de l'ensemble de données et de ses nuances, visite le site officiel de DOTA.

FAQ

Qu'est-ce que l'ensemble de données DOTA8 et comment peut-on l'utiliser ?

L'ensemble de données DOTA8 est un petit ensemble de données polyvalent de détection d'objets composé des 8 premières images de l'ensemble divisé DOTAv1, avec 4 images désignées pour l'entraînement et 4 pour la validation. Il est idéal pour tester et déboguer des modèles de détection d'objets tels que Ultralytics YOLOv8 . En raison de sa taille et de sa diversité gérables, il permet d'identifier les erreurs de pipeline et d'effectuer des vérifications avant de déployer des ensembles de données plus importants. En savoir plus sur la détection d'objets avec Ultralytics YOLOv8.

Comment entraîner un modèle YOLOv8 en utilisant l'ensemble de données DOTA8 ?

Pour entraîner un modèle YOLOv8n-obb sur l'ensemble de données DOTA8 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour connaître toutes les options d'arguments, reporte-toi à la page Formation du modèle.

Exemple de train

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Quelles sont les principales caractéristiques de l'ensemble de données DOTA et où puis-je accéder au fichier YAML ?

L'ensemble de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il représente pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA8 est un ensemble de données plus petit et plus facile à gérer, idéal pour les premiers tests. Tu peux accéder à l'ensemble de données DOTA8 dota8.yaml qui contient les chemins d'accès, les classes et les détails de la configuration. Lien GitHub.

Comment le mosaïquage améliore-t-il la formation des modèles avec l'ensemble de données DOTA8 ?

La mosaïque combine plusieurs images en une seule pendant la formation, ce qui augmente la variété des objets et des contextes dans chaque lot. Cela améliore la capacité d'un modèle à se généraliser à différentes tailles d'objets, à différents rapports d'aspect et à différentes scènes. Cette technique peut être démontrée visuellement à l'aide d'un lot d'entraînement composé d'images mosaïquées de l'ensemble de données DOTA8, ce qui contribue au développement d'un modèle robuste. Pour en savoir plus sur les mosaïques et les techniques de formation, consulte notre page Formation.

Pourquoi devrais-je utiliser Ultralytics YOLOv8 pour les tâches de détection d'objets ?

Ultralytics YOLOv8 offre des capacités de pointe en matière de détection d'objets en temps réel, y compris des fonctions telles que les boîtes de délimitation orientées (OBB), la segmentation des instances et un pipeline d'apprentissage très polyvalent. Il est adapté à diverses applications et propose des modèles pré-entraînés pour une mise au point efficace. Pour en savoir plus sur les avantages et l'utilisation de ce logiciel, consulte la documentation deUltralytics YOLOv8 .



Créé le 2024-01-09, Mis à jour le 2024-07-04
Auteurs : glenn-jocher (3), Laughing-q (1)

Commentaires