Ir al contenido

Conjunto de datos DOTA8

Introducción

Ultralytics DOTA8 es un conjunto de datos pequeño pero versátil de detección de objetos orientados, compuesto por las primeras 8 imágenes del conjunto DOTAv1 dividido, 4 para entrenamiento y 4 para validación. Este conjunto de datos es ideal para probar y depurar modelos de detección de objetos, o para experimentar con nuevos enfoques de detección. Con 8 imágenes, es lo suficientemente pequeño como para ser fácilmente manejable, pero lo suficientemente diverso como para probar las canalizaciones de entrenamiento en busca de errores y actuar como una verificación de integridad antes de entrenar conjuntos de datos más grandes.

Este conjunto de datos está destinado a ser utilizado con HUB y YOLO11 de Ultralytics.

YAML del conjunto de datos

Se utiliza un archivo YAML (Yet Another Markup Language) para definir la configuración del conjunto de datos. Contiene información sobre las rutas, las clases y otra información relevante del conjunto de datos. En el caso del conjunto de datos DOTA8, el dota8.yaml archivo se mantiene en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Uso

Para entrenar un modelo YOLO11n-obb en el conjunto de datos DOTA8 durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

sample_images y anotaciones

Aquí hay algunos ejemplos de imágenes del conjunto de datos DOTA8, junto con sus correspondientes anotaciones:

Imagen de muestra del conjunto de datos

  • Imagen en mosaico: Esta imagen muestra un lote de entrenamiento compuesto por imágenes en mosaico del conjunto de datos. El mosaico es una técnica utilizada durante el entrenamiento que combina varias imágenes en una sola imagen para aumentar la variedad de objetos y escenas dentro de cada lote de entrenamiento. Esto ayuda a mejorar la capacidad del modelo para generalizar a diferentes tamaños de objetos, relaciones de aspecto y contextos.

El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos DOTA8 y los beneficios de usar mosaicos durante el proceso de entrenamiento.

Citas y agradecimientos

Si utiliza el conjunto de datos DOTA en su trabajo de investigación o desarrollo, cite el siguiente artículo:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Un agradecimiento especial al equipo detrás de los conjuntos de datos DOTA por su encomiable esfuerzo en la curación de este conjunto de datos. Para una comprensión exhaustiva del conjunto de datos y sus matices, visite el sitio web oficial de DOTA.

Preguntas frecuentes

¿Qué es el conjunto de datos DOTA8 y cómo se puede utilizar?

El conjunto de datos DOTA8 es un conjunto de datos pequeño y versátil de detección de objetos orientados que se compone de las 8 primeras imágenes del conjunto de división DOTAv1, con 4 imágenes designadas para el entrenamiento y 4 para la validación. Es ideal para probar y depurar modelos de detección de objetos como Ultralytics YOLO11. Debido a su tamaño manejable y su diversidad, ayuda a identificar errores de canalización y a ejecutar comprobaciones de integridad antes de implementar conjuntos de datos más grandes. Obtenga más información sobre la detección de objetos con Ultralytics YOLO11.

¿Cómo entreno un modelo YOLO11 usando el conjunto de datos DOTA8?

Para entrenar un modelo YOLO11n-obb en el conjunto de datos DOTA8 durante 100 épocas con un tamaño de imagen de 640, puede utilizar los siguientes fragmentos de código. Para obtener información completa sobre las opciones de argumentos, consulte la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

¿Cuáles son las principales características del conjunto de datos DOTA y dónde puedo acceder al archivo YAML?

El conjunto de datos DOTA es conocido por su evaluación comparativa a gran escala y los desafíos que presenta para la detección de objetos en imágenes aéreas. El subconjunto DOTA8 es un conjunto de datos más pequeño y manejable, ideal para las pruebas iniciales. Puede acceder al dota8.yaml archivo, que contiene rutas, clases y detalles de configuración, en este Enlace de GitHub.

¿Cómo mejora el mosaico el entrenamiento del modelo con el conjunto de datos DOTA8?

El mosaico combina múltiples imágenes en una sola durante el entrenamiento, aumentando la variedad de objetos y contextos dentro de cada lote. Esto mejora la capacidad de un modelo para generalizar a diferentes tamaños de objeto, relaciones de aspecto y escenas. Esta técnica puede demostrarse visualmente a través de un lote de entrenamiento compuesto por imágenes del conjunto de datos DOTA8 en mosaico, lo que ayuda en el desarrollo de modelos robustos. Explora más sobre el mosaico y las técnicas de entrenamiento en nuestra página de Entrenamiento.

¿Por qué debería usar Ultralytics YOLO11 para tareas de detección de objetos?

Ultralytics YOLO11 proporciona capacidades de detección de objetos en tiempo real de última generación, incluyendo características como cajas delimitadoras orientadas (OBB), segmentación de instancias y un pipeline de entrenamiento altamente versátil. Es adecuado para diversas aplicaciones y ofrece modelos pre-entrenados para un ajuste fino eficiente. Explore más sobre las ventajas y el uso en la documentación de Ultralytics YOLO11.



📅 Creado hace 1 año ✏️ Actualizado hace 5 meses

Comentarios