Ensemble de données DOTA8
Introduction
Ultralytics DOTA8 est un petit mais polyvalent jeu de données de détection d'objets orientés, composé des 8 premières images de l'ensemble DOTAv1 divisé, 4 pour l'entraînement et 4 pour la validation. Ce jeu de données est idéal pour tester et déboguer des modèles de détection d'objets, ou pour expérimenter de nouvelles approches de détection. Avec 8 images, il est suffisamment petit pour être facilement gérable, mais suffisamment diversifié pour tester les pipelines d'entraînement à la recherche d'erreurs et servir de contrôle de cohérence avant d'entraîner des jeux de données plus volumineux.
Ce jeu de données est destiné à être utilisé avec HUB Ultralytics et YOLO11.
YAML du jeu de données
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration de l'ensemble de données. Il contient des informations sur les chemins d'accès, les classes et d'autres informations pertinentes de l'ensemble de données. Dans le cas de l'ensemble de données DOTA8, le dota8.yaml
fichier est maintenu à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip
Utilisation
Pour entraîner un modèle YOLO11n-obb sur le jeu de données DOTA8 pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consultez la page Formation du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Images et annotations d'exemple
Voici quelques exemples d'images du jeu de données DOTA8, ainsi que leurs annotations correspondantes :
- Image mosaïque : Cette image montre un lot d'entraînement composé d'images d'ensemble de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes dans chaque lot d'entraînement. Cela permet d'améliorer la capacité du modèle à se généraliser à différentes tailles d'objets, rapports hauteur/largeur et contextes.
Cet exemple illustre la variété et la complexité des images dans l'ensemble de données DOTA8, ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.
Citations et remerciements
Si vous utilisez l'ensemble de données DOTA dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Une note spéciale de gratitude à l'équipe derrière les ensembles de données DOTA pour leurs efforts louables dans la conservation de cet ensemble de données. Pour une compréhension exhaustive de l'ensemble de données et de ses nuances, veuillez visiter le site Web officiel de DOTA.
FAQ
Qu'est-ce que le jeu de données DOTA8 et comment peut-il être utilisé ?
L'ensemble de données DOTA8 est un petit ensemble de données polyvalent de détection d'objets orientés, composé des 8 premières images de l'ensemble de division DOTAv1, avec 4 images désignées pour l'entraînement et 4 pour la validation. Il est idéal pour tester et déboguer des modèles de détection d'objets tels que Ultralytics YOLO11. En raison de sa taille et de sa diversité gérables, il permet d'identifier les erreurs de pipeline et d'exécuter des contrôles de cohérence avant de déployer des ensembles de données plus volumineux. Apprenez-en davantage sur la détection d'objets avec Ultralytics YOLO11.
Comment entraîner un modèle YOLO11 en utilisant le jeu de données DOTA8 ?
Pour entraîner un modèle YOLO11n-obb sur le jeu de données DOTA8 pendant 100 epochs avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour connaître les options d'arguments complètes, consultez la page Formation du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640
Quelles sont les principales caractéristiques du jeu de données DOTA et où puis-je accéder au fichier YAML ?
L'ensemble de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il pose pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA8 est un ensemble de données plus petit et plus facile à gérer, idéal pour les tests initiaux. Vous pouvez accéder au dota8.yaml
fichier, qui contient les chemins d'accès, les classes et les détails de configuration, à ce Lien GitHub.
Comment le mosaïquage améliore-t-il l'entraînement du modèle avec l'ensemble de données DOTA8 ?
La mosaïque combine plusieurs images en une seule pendant l'entraînement, ce qui augmente la variété des objets et des contextes dans chaque lot. Cela améliore la capacité d'un modèle à se généraliser à différentes tailles d'objets, rapports d'aspect et scènes. Cette technique peut être démontrée visuellement par un lot d'entraînement composé d'images de l'ensemble de données DOTA8 en mosaïque, ce qui contribue au développement d'un modèle robuste. Pour en savoir plus sur la mosaïque et les techniques d'entraînement, consultez notre page Entraînement.
Pourquoi devrais-je utiliser Ultralytics YOLO11 pour les tâches de détection d'objets ?
Ultralytics YOLO11 offre des capacités de détection d'objets en temps réel de pointe, y compris des fonctionnalités telles que les boîtes englobantes orientées (OBB), la segmentation d'instance et un pipeline d'entraînement très polyvalent. Il convient à diverses applications et offre des modèles pré-entraînés pour un réglage fin efficace. Explorez davantage les avantages et l'utilisation dans la documentation d'Ultralytics YOLO11.