Jeu de données DOTA128#

Name: Jeu de données OBB DOTA128
Creator: Ultralytics
License: https://captain-whu.github.io/DOTA/dataset.html
Keywords: Jeu de données DOTA128, Ultralytics, YOLO26, détection d'objets, débogage, entraînement de modèles, détection d'objets orientés, YAML de jeu de données

Introduction#

Ultralytics DOTA128 est un petit jeu de données polyvalent de détection d'objets orientés composé de 128 images issues du jeu DOTAv1, 128 pour l'entraînement et la validation. Ce jeu de données est idéal pour tester et déboguer des modèles de boîtes englobantes orientées (OBB), ou pour expérimenter de nouvelles approches de détection. Avec 128 images, il est suffisamment petit pour être facilement gérable, tout en étant assez diversifié pour tester les pipelines d'entraînement à la recherche d'erreurs et servir de vérification de bon sens avant d'entraîner des jeux de données plus volumineux.

Structure du jeu de données#

Images : 128 tuiles aériennes (toutes dans le dossier train, utilisées à la fois pour train et val) provenant de DOTAv1.
Classes : Hérite des 15 catégories DOTAv1 telles que plane, ship et large vehicle.
Étiquettes : Boîtes englobantes orientées au format YOLO enregistrées sous forme de fichiers .txt à côté de chaque image.
Téléchargement : 34 Mo, récupéré automatiquement depuis les ressources GitHub de Ultralytics la première fois que tu lances un entraînement.

Ce jeu de données est destiné à être utilisé avec Ultralytics Platform et YOLO26.

YAML du jeu de données#

Un fichier YAML est utilisé pour définir la configuration du jeu de données. Il contient des informations sur les chemins du jeu de données, les classes et d'autres informations pertinentes. Dans le cas du jeu de données DOTA128, le fichier dota128.yaml est maintenu sur https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Utilisation#

Pour entraîner un modèle YOLO26n-obb sur le jeu de données DOTA128 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour une liste complète des arguments disponibles, consulte la page Entraînement du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Exemples d'images et annotations#

Voici quelques exemples d'images du jeu de données DOTA128, accompagnées de leurs annotations correspondantes :

DOTA128 oriented bounding box dataset training mosaic

Image mosaïquée : Cette image montre un lot d'entraînement composé d'images du jeu de données mosaïquées. La mosaïque est une technique utilisée pendant l'entraînement qui combine plusieurs images en une seule pour augmenter la variété des objets et des scènes au sein de chaque lot d'entraînement. Cela aide à améliorer la capacité du modèle à généraliser à différentes tailles d'objets, ratios d'aspect et contextes.

L'exemple présente la variété et la complexité des images du jeu de données DOTA128 ainsi que les avantages de l'utilisation du mosaïquage pendant le processus d'entraînement.

Citations et remerciements#

Si tu utilises le jeu de données DOTA dans tes travaux de recherche ou de développement, merci de citer l'article suivant :

Citation

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2022},
  volume={44},
  number={11},
  pages={7778-7796},
  doi={10.1109/TPAMI.2021.3117983}
}

Une note de gratitude spéciale à l'équipe derrière les jeux de données DOTA pour leurs efforts louables dans la curation de ce jeu de données. Pour une compréhension exhaustive du jeu de données et de ses nuances, visite le site officiel DOTA.

FAQ#

Qu'est-ce que le jeu de données DOTA128 et comment peut-il être utilisé ?#

Le jeu de données DOTA128 est un jeu de données polyvalent de détection d'objets orientés composé de 128 images issues du jeu DOTAv1, toutes stockées dans le dossier train. L'entraînement et la validation utilisent le même ensemble d'images, ce qui le rend idéal pour des workflows de test et de débogage rapides. Il est parfait pour tester et déboguer des modèles OBB comme Ultralytics YOLO26. Grâce à sa taille gérable et sa diversité, il aide à identifier les erreurs de pipeline et à effectuer des vérifications de bon sens avant de déployer des jeux de données plus importants. En savoir plus sur la détection OBB avec Ultralytics YOLO26.

Comment puis-je entraîner un modèle YOLO26 en utilisant le jeu de données DOTA128 ?#

Pour entraîner un modèle YOLO26n-obb sur le jeu de données DOTA128 pendant 100 époques avec une taille d'image de 640, tu peux utiliser les extraits de code suivants. Pour des options d'arguments complètes, consulte la page Entraînement du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Quelles sont les fonctionnalités clés du jeu de données DOTA et où puis-je accéder au fichier YAML ?#

Le jeu de données DOTA est connu pour son benchmark à grande échelle et les défis qu'il présente pour la détection d'objets dans les images aériennes. Le sous-ensemble DOTA128 offre plus de diversité que DOTA8 tout en restant gérable pour des tests initiaux. Tu peux accéder au fichier dota128.yaml, qui contient les chemins, les classes et les détails de configuration, via ce lien GitHub.

Comment DOTA128 se compare-t-il aux autres variantes du jeu de données DOTA ?#

DOTA128 (128 images) se situe entre DOTA8 (8 images) et le jeu de données complet DOTA-v1 (1 869 images) en termes de taille :

DOTA8 : Contient seulement 8 images (4 pour l'entraînement, 4 pour la validation) - idéal pour des tests rapides et le débogage
DOTA128 : Contient 128 images (toutes dans le dossier train, utilisées pour l'entraînement et la validation) - équilibré entre taille et diversité
DOTA-v1 complet : Contient 1 869 images - complet mais gourmand en ressources

DOTA128 offre un bon juste milieu, proposant plus de diversité que DOTA8 tout en restant beaucoup plus gérable que le jeu de données DOTA complet pour l'expérimentation et le développement initial de modèles.

Comment le mosaïquage améliore-t-il l'entraînement du modèle avec le jeu de données DOTA128 ?#

Le mosaïquage combine plusieurs images en une seule pendant l'entraînement, augmentant la variété des objets et des contextes au sein de chaque lot. Cela améliore la capacité d'un modèle à généraliser à différentes tailles d'objets, rapports d'aspect et scènes. Cette technique peut être démontrée visuellement à travers un lot d'entraînement composé d'images du jeu de données DOTA128 mosaïquées, aidant au développement de modèles robustes. Explore davantage le mosaïquage et les techniques d'entraînement sur notre page Entraînement.

Pourquoi devrais-je utiliser Ultralytics YOLO26 pour des tâches de détection d'objets orientés ?#

Ultralytics YOLO26 offre des capacités de détection d'objets en temps réel à la pointe de la technologie, incluant des fonctionnalités comme les boîtes englobantes orientées (OBB), la segmentation d'instances et un pipeline d'entraînement hautement polyvalent. Il est adapté à diverses applications et propose des modèles pré-entraînés pour un réglage fin efficace. Explore davantage les avantages et l'utilisation dans la documentation d'Ultralytics YOLO26.

Contributeurs

GLglenn-jocher² RAraimbekovm² LALaughing-q¹

Créé il y a 4 moisMis à jour il y a 2 semaines