Link to this sectionConjunto de datos DOTA128#
Link to this sectionIntroducción#
Ultralytics DOTA128 es un conjunto de datos pequeño pero versátil de detección de objetos orientada, compuesto por 128 imágenes del set DOTAv1, 128 para entrenamiento y validación. Este conjunto de datos es ideal para probar y depurar modelos de cajas delimitadoras orientadas (OBB), o para experimentar con nuevos enfoques de detección. Con 128 imágenes, es lo suficientemente pequeño como para ser fácilmente manejable, pero lo bastante diverso como para probar los pipelines de entrenamiento en busca de errores y actuar como una verificación de integridad antes de entrenar con conjuntos de datos más grandes.
Link to this sectionEstructura del conjunto de datos#
- Imágenes: 128 teselas aéreas (todas en la carpeta train, utilizadas tanto para train como para val) provenientes de DOTAv1.
- Clases: Hereda las 15 categorías de DOTAv1, tales como avión, barco y vehículo grande.
- Etiquetas: Cajas delimitadoras orientadas en formato YOLO guardadas como archivos
.txtjunto a cada imagen.
Este conjunto de datos está diseñado para su uso con Ultralytics Platform y YOLO26.
Link to this sectionYAML del conjunto de datos#
Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas del conjunto de datos, las clases y otra información relevante. En el caso del conjunto de datos DOTA128, el archivo dota128.yaml se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipLink to this sectionUso#
Para entrenar un modelo YOLO26n-obb en el conjunto de datos DOTA128 durante 100 épocas con un tamaño de imagen de 640, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this sectionImágenes y anotaciones de muestra#
Aquí tienes algunos ejemplos de imágenes del conjunto de datos DOTA128, junto con sus anotaciones correspondientes:
- Imagen en mosaico: esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina múltiples imágenes en una sola para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y contextos.
El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos DOTA128 y los beneficios de utilizar mosaicos durante el proceso de entrenamiento.
Link to this sectionCitas y reconocimientos#
Si utilizas el conjunto de datos DOTA en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}Una nota especial de gratitud al equipo detrás de los conjuntos de datos DOTA por su encomiable esfuerzo en la curaduría de este conjunto de datos. Para una comprensión exhaustiva del conjunto de datos y sus matices, visita el sitio web oficial de DOTA.
Link to this sectionPreguntas frecuentes#
Link to this section¿Qué es el conjunto de datos DOTA128 y cómo se puede utilizar?#
El conjunto de datos DOTA128 es un versátil conjunto de datos de detección de objetos orientada compuesto por 128 imágenes del set DOTAv1, todas almacenadas en la carpeta train. Tanto el entrenamiento como la validación utilizan el mismo conjunto de imágenes, lo que lo hace ideal para flujos de trabajo rápidos de prueba y depuración. Es ideal para probar y depurar modelos OBB como Ultralytics YOLO26. Debido a su tamaño manejable y diversidad, ayuda a identificar errores en el pipeline y a realizar comprobaciones de integridad antes de desplegar conjuntos de datos más grandes. Aprende más sobre la detección OBB con Ultralytics YOLO26.
Link to this section¿Cómo entreno un modelo YOLO26 utilizando el conjunto de datos DOTA128?#
Para entrenar un modelo YOLO26n-obb en el conjunto de datos DOTA128 durante 100 épocas con un tamaño de imagen de 640, puedes usar los siguientes fragmentos de código. Para obtener opciones de argumentos exhaustivas, consulta la página de Entrenamiento del modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)Link to this section¿Cuáles son las características clave del conjunto de datos DOTA y dónde puedo acceder al archivo YAML?#
El conjunto de datos DOTA es conocido por su benchmark a gran escala y los desafíos que presenta para la detección de objetos en imágenes aéreas. El subconjunto DOTA128 proporciona más diversidad que DOTA8, manteniendo al mismo tiempo la facilidad de manejo para pruebas iniciales. Puedes acceder al archivo dota128.yaml, que contiene rutas, clases y detalles de configuración, en este enlace de GitHub.
Link to this section¿Cómo se compara DOTA128 con otras variantes del conjunto de datos DOTA?#
DOTA128 (128 imágenes) se sitúa entre DOTA8 (8 imágenes) y el conjunto de datos completo DOTA-v1 (1.869 imágenes) en términos de tamaño:
- DOTA8: Contiene solo 8 imágenes (4 train, 4 val) - ideal para pruebas rápidas y depuración
- DOTA128: Contiene 128 imágenes (todas en la carpeta train, utilizadas tanto para train como para val) - equilibrado entre tamaño y diversidad
- DOTA-v1 completo: Contiene 1.869 imágenes - exhaustivo pero requiere muchos recursos
DOTA128 proporciona un buen punto medio, ofreciendo más diversidad que DOTA8 mientras sigue siendo mucho más manejable que el conjunto de datos DOTA completo para la experimentación y el desarrollo inicial de modelos.
Link to this section¿Cómo mejora el mosaico el entrenamiento del modelo con el conjunto de datos DOTA128?#
El mosaico combina varias imágenes en una durante el entrenamiento, aumentando la variedad de objetos y contextos dentro de cada lote. Esto mejora la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y escenas. Esta técnica puede demostrarse visualmente a través de un lote de entrenamiento compuesto por imágenes del conjunto de datos DOTA128 en mosaico, ayudando en el desarrollo robusto de modelos. Explora más sobre el mosaico y las técnicas de entrenamiento en nuestra página de Entrenamiento.
Link to this section¿Por qué debería usar Ultralytics YOLO26 para tareas de detección de objetos orientada?#
Ultralytics YOLO26 proporciona capacidades de detección de objetos en tiempo real de vanguardia, incluyendo características como cajas delimitadoras orientadas (OBB), segmentación de instancias y un pipeline de entrenamiento altamente versátil. Es adecuado para diversas aplicaciones y ofrece modelos preentrenados para un ajuste fino eficiente. Explora más a fondo sobre las ventajas y el uso en la documentación de Ultralytics YOLO26.