Dataset DOTA8
Introducción
Ultralytics DOTA8 es un dataset de detección de objetos orientado, pequeño pero versátil, compuesto por las primeras 8 imágenes del set DOTAv1 dividido, 4 para entrenamiento y 4 para validación. Este dataset es ideal para probar y depurar modelos de detección de objetos, o para experimentar con nuevos enfoques de detección. Con 8 imágenes, es lo suficientemente pequeño como para ser fácilmente manejable, pero lo bastante diverso para probar errores en los flujos de trabajo de entrenamiento y actuar como una comprobación de integridad antes de entrenar con datasets más grandes.
Estructura del conjunto de datos
-
Imágenes: 8 teselas aéreas (4 de entrenamiento, 4 de validación) provenientes de DOTAv1.
-
Clases: Hereda las 15 categorías de DOTAv1, como avión, barco y vehículo grande.
-
Etiquetas: Cajas delimitadoras orientadas en formato YOLO guardadas como archivos
.txtjunto a cada imagen. -
Diseño recomendado:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
Este conjunto de datos está diseñado para su uso con Ultralytics Platform y YOLO26.
YAML del conjunto de datos
Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del dataset. Contiene información sobre las rutas del dataset, las clases y otra información relevante. En el caso del dataset DOTA8, el archivo dota8.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zipUso
Para entrenar un modelo YOLO26n-obb en el dataset DOTA8 durante 100 epochs con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Imágenes y anotaciones de muestra
Aquí tienes algunos ejemplos de imágenes del dataset DOTA8, junto con sus correspondientes anotaciones:
- Imagen en mosaico: esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes en el dataset DOTA8 y los beneficios de usar mosaico (mosaicing) durante el proceso de entrenamiento.
Citas y reconocimientos
Si utilizas el dataset DOTA en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Una nota especial de gratitud al equipo detrás de los datasets DOTA por su encomiable esfuerzo en la curación de este dataset. Para una comprensión exhaustiva del dataset y sus matices, por favor visita el sitio web oficial de DOTA.
Preguntas frecuentes
¿Qué es el dataset DOTA8 y cómo se puede utilizar?
El dataset DOTA8 es un dataset de detección de objetos orientado, pequeño y versátil, formado por las primeras 8 imágenes del set dividido DOTAv1, con 4 imágenes designadas para entrenamiento y 4 para validación. Es ideal para probar y depurar modelos de detección de objetos como Ultralytics YOLO26. Debido a su tamaño manejable y su diversidad, ayuda a identificar errores en el flujo de trabajo y a realizar comprobaciones de integridad antes de desplegar datasets más grandes. Aprende más sobre la detección de objetos con Ultralytics YOLO26.
¿Cómo entreno un modelo YOLO26 usando el dataset DOTA8?
Para entrenar un modelo YOLO26n-obb en el dataset DOTA8 durante 100 epochs con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener opciones de argumentos completas, consulta la página de Entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)¿Cuáles son las características clave del dataset DOTA y dónde puedo acceder al archivo YAML?
El dataset DOTA es conocido por su benchmark a gran escala y los desafíos que presenta para la detección de objetos en imágenes aéreas. El subconjunto DOTA8 es un dataset más pequeño y manejable, ideal para pruebas iniciales. Puedes acceder al archivo dota8.yaml, que contiene rutas, clases y detalles de configuración, en este enlace de GitHub.
¿Cómo mejora el mosaico (mosaicing) el entrenamiento del modelo con el dataset DOTA8?
El mosaico combina múltiples imágenes en una durante el entrenamiento, aumentando la variedad de objetos y contextos dentro de cada lote. Esto mejora la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y escenas. Esta técnica se puede demostrar visualmente a través de un lote de entrenamiento compuesto por imágenes del dataset DOTA8 en mosaico, ayudando en el desarrollo de un modelo robusto. Explora más sobre el mosaico y las técnicas de entrenamiento en nuestra página de Entrenamiento.
¿Por qué debería usar Ultralytics YOLO26 para tareas de detección de objetos?
Ultralytics YOLO26 proporciona capacidades de detección de objetos en tiempo real de última generación, incluyendo características como cajas delimitadoras orientadas (OBB), segmentación de instancias y un flujo de trabajo de entrenamiento altamente versátil. Es adecuado para diversas aplicaciones y ofrece modelos preentrenados para un ajuste fino eficiente. Explora más sobre las ventajas y el uso en la documentación de Ultralytics YOLO26.