Ensemble de données DOTA128
Introduction
Ultralytics DOTA128 est un ensemble de données de détection d'objets orienté, petit mais polyvalent, composé de 128 images issues de l'ensemble DOTAv1, dont 128 sont destinées à l'entraînement et à la validation. Cet ensemble de données est idéal pour tester et déboguer des modèles de boîtes englobantes orientées (OBB) ou pour expérimenter de nouvelles approches de détection. Avec 128 images, il est suffisamment petit pour être facilement gérable, mais suffisamment diversifié pour tester les pipelines de formation afin de détecter les erreurs et servir de contrôle de cohérence avant de former des ensembles de données plus importants.
Structure du jeu de données
- Images: 128 tuiles aériennes (toutes dans le dossier train, utilisées à la fois pour train et val) provenant de DOTAv1.
- Classes : Hérite des 15 catégories DOTAv1 telles que les avions, les bateaux et les grands véhicules.
- Étiquettes: Boîtes englobantes orientées au format YOLO enregistrées comme
.txtfichiers à côté de chaque image.
Cet ensemble de données est destiné à être utilisé avec la Plateforme Ultralytics et YOLO26.
YAML du jeu de données
Un fichier YAML (Yet Another Markup Language) est utilisé pour définir la configuration de l'ensemble de données. Il contient des informations sur les chemins d'accès, les classes et d'autres informations pertinentes relatives à l'ensemble de données. Dans le cas de l'ensemble de données DOTA128, le fichier dota128.yaml fichier est maintenu à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip
Utilisation
Pour entraîner unobb sur l'ensemble de données DOTA128 pendant 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour obtenir la liste complète des arguments disponibles, consultez la page Entraînement du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Images et annotations d'exemple
Voici quelques exemples d'images issues du jeu de données DOTA128, accompagnées de leurs annotations correspondantes :

- Image mosaïque : Cette image montre un lot d'entraînement composé d'images d'ensemble de données en mosaïque. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule image pour augmenter la variété des objets et des scènes dans chaque lot d'entraînement. Cela permet d'améliorer la capacité du modèle à se généraliser à différentes tailles d'objets, rapports hauteur/largeur et contextes.
Cet exemple illustre la diversité et la complexité des images contenues dans le jeu de données DOTA128, ainsi que les avantages de l'utilisation de la mosaïque pendant le processus d'apprentissage.
Citations et remerciements
Si vous utilisez l'ensemble de données DOTA dans vos travaux de recherche ou de développement, veuillez citer l'article suivant :
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Une note spéciale de gratitude à l'équipe derrière les ensembles de données DOTA pour leurs efforts louables dans la conservation de cet ensemble de données. Pour une compréhension exhaustive de l'ensemble de données et de ses nuances, veuillez visiter le site Web officiel de DOTA.
FAQ
Qu'est-ce que l'ensemble de données DOTA128 et comment peut-il être utilisé ?
Le jeu de données DOTA128 est un jeu de données polyvalent orienté détection d'objets composé de 128 images issues du jeu DOTAv1, toutes stockées dans le dossier train. L'entraînement et la validation utilisent le même ensemble d'images, ce qui le rend idéal pour les tests rapides et les workflows de débogage. Il est idéal pour tester et déboguer des modèles OBB tels que Ultralytics . Grâce à sa taille raisonnable et à sa diversité, il permet d'identifier les erreurs de pipeline et d'effectuer des contrôles de cohérence avant de déployer des ensembles de données plus volumineux. En savoir plus sur la détection OBB avec Ultralytics .
Comment entraîner un modèle YOLO26 à l'aide de l'ensemble de données DOTA128 ?
Pour entraîner unobb sur l'ensemble de données DOTA128 pendant 100 époques avec une taille d'image de 640, vous pouvez utiliser les extraits de code suivants. Pour connaître toutes les options d'argument, consultez la page Entraînement du modèle.
Exemple d'entraînement
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Quelles sont les principales caractéristiques du jeu de données DOTA et où puis-je accéder au fichier YAML ?
Le jeu de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il présente pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA128 offre plus de diversité que DOTA8 tout en restant gérable pour les tests initiaux. Vous pouvez accéder au dota128.yaml fichier, qui contient les chemins d'accès, les classes et les détails de configuration, à ce Lien GitHub.
Comment DOTA128 se compare-t-il aux autres variantes de l'ensemble de données DOTA ?
DOTA128 (128 images) se situe entre DOTA8 (8 images) et l'ensemble de données complet DOTA-v1 (1 869 images) en termes de taille :
- DOTA8: contient seulement 8 images (4 train, 4 val) - idéal pour les tests rapides et le débogage
- DOTA128: contient 128 images (toutes dans le dossier train, utilisées à la fois pour train et val) - équilibre entre taille et diversité
- DOTA-v1 complet: contient 1 869 images - complet mais gourmand en ressources
DOTA128 offre un bon compromis, avec plus de diversité que DOTA8 tout en restant beaucoup plus facile à gérer que l'ensemble complet de données DOTA pour l'expérimentation et le développement initial du modèle.
Comment la mosaïque améliore-t-elle l'entraînement des modèles avec l'ensemble de données DOTA128 ?
Le mosaïquage combine plusieurs images en une seule pendant l'entraînement, ce qui augmente la variété des objets et des contextes dans chaque lot. Cela améliore la capacité d'un modèle à généraliser différentes tailles d'objets, différents formats et différentes scènes. Cette technique peut être illustrée visuellement à l'aide d'un lot d'entraînement composé d'images mosaïquées issues de l'ensemble de données DOTA128, ce qui contribue à un développement robuste du modèle. Pour en savoir plus sur le mosaïquage et les techniques d'entraînement, consultez notre page Entraînement.
Pourquoi devrais-je utiliser Ultralytics pour les tâches de détection d'objets orientées ?
Ultralytics YOLO26 offre des capacités de détection d'objets en temps réel à la pointe de la technologie, incluant des fonctionnalités telles que les boîtes englobantes orientées (OBB), la segmentation d'instances, et un pipeline d'entraînement très polyvalent. Il convient à diverses applications et propose des modèles pré-entraînés pour un ajustement fin efficace. Explorez davantage les avantages et l'utilisation dans la documentation Ultralytics YOLO26.