Jeu de données DOTA8
Introduction
Le DOTA8 d'Ultralytics est un petit jeu de données polyvalent pour la détection d'objets orientés, composé des 8 premières images du jeu fractionné DOTAv1, 4 pour l'entraînement et 4 pour la validation. Ce jeu de données est idéal pour tester et déboguer des modèles de détection d'objets, ou pour expérimenter de nouvelles approches de détection. Avec 8 images, il est suffisamment petit pour être facilement gérable, tout en étant assez diversifié pour tester les pipelines d'entraînement à la recherche d'erreurs et servir de vérification de cohérence avant d'entraîner sur des jeux de données plus volumineux.
Structure du jeu de données
-
Images : 8 tuiles aériennes (4 pour l'entraînement, 4 pour la validation) provenant de DOTAv1.
-
Classes : Hérite des 15 catégories de DOTAv1 telles que avion, navire et gros véhicule.
-
Étiquettes : Boîtes englobantes orientées au format YOLO enregistrées sous forme de fichiers
.txtà côté de chaque image. -
Disposition recommandée :
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Ce jeu de données est destiné à être utilisé avec Ultralytics Platform et YOLO26.
YAML du jeu de données
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins du jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données DOTA8, le fichier dota8.yaml est maintenu sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zipUtilisation
Pour entraîner un modèle YOLO26n-obb sur le jeu de données DOTA8 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page de Training du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Exemples d'images et d'annotations
Voici quelques exemples d'images du jeu de données DOTA8, accompagnées de leurs annotations correspondantes :
- Image en mosaïque : Cette image démontre un lot d'entraînement composé d'images du jeu de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes au sein de chaque lot d'entraînement. Cela aide à améliorer la capacité du modèle à généraliser à différentes tailles d'objets, ratios d'aspect et contextes.
L'exemple met en évidence la variété et la complexité des images du jeu de données DOTA8 ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.
Citations et remerciements
Si tu utilises le jeu de données DOTA dans tes travaux de recherche ou de développement, merci de citer l'article suivant :
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Une mention spéciale de gratitude à l'équipe derrière les jeux de données DOTA pour leurs efforts louables dans la curation de ce jeu de données. Pour une compréhension exhaustive du jeu de données et de ses nuances, visite le site officiel de DOTA.
FAQ
Qu'est-ce que le jeu de données DOTA8 et comment peut-il être utilisé ?
Le jeu de données DOTA8 est un petit jeu de données polyvalent pour la détection d'objets orientés, composé des 8 premières images du jeu fractionné DOTAv1, avec 4 images désignées pour l'entraînement et 4 pour la validation. Il est idéal pour tester et déboguer des modèles de détection d'objets comme Ultralytics YOLO26. Grâce à sa taille gérable et sa diversité, il aide à identifier les erreurs de pipeline et à effectuer des vérifications de cohérence avant de déployer des jeux de données plus importants. En savoir plus sur la détection d'objets avec Ultralytics YOLO26.
Comment entraîner un modèle YOLO26 en utilisant le jeu de données DOTA8 ?
Pour entraîner un modèle YOLO26n-obb sur le jeu de données DOTA8 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour des options d'arguments complètes, consulte la page de Training du modèle.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Quelles sont les caractéristiques clés du jeu de données DOTA et où puis-je accéder au fichier YAML ?
Le jeu de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il présente pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA8 est un jeu de données plus petit et gérable, idéal pour les tests initiaux. Tu peux accéder au fichier dota8.yaml, qui contient les chemins, les classes et les détails de configuration, via ce lien GitHub.
Comment le mosaïquage améliore-t-il l'entraînement du modèle avec le jeu de données DOTA8 ?
Le mosaïquage combine plusieurs images en une seule pendant l'entraînement, augmentant la variété des objets et des contextes au sein de chaque lot. Cela améliore la capacité d'un modèle à généraliser à différentes tailles d'objets, proportions et scènes. Cette technique peut être démontrée visuellement à travers un lot d'entraînement composé d'images du jeu de données DOTA8 mosaïquées, aidant au développement robuste du modèle. Explore davantage le mosaïquage et les techniques d'entraînement sur notre page Training.
Pourquoi devrais-je utiliser Ultralytics YOLO26 pour les tâches de détection d'objets ?
Ultralytics YOLO26 fournit des capacités de détection d'objets en temps réel à la pointe de la technologie, incluant des fonctionnalités comme les boîtes englobantes orientées (OBB), la segmentation d'instances et un pipeline d'entraînement hautement polyvalent. Il est adapté à diverses applications et propose des modèles pré-entraînés pour un réglage fin efficace. Explore davantage les avantages et l'utilisation dans la documentation d'Ultralytics YOLO26.