Saltar para o conteúdo

Conjunto de dados DOTA8

Introdução

Ultralytics O DOTA8 é um pequeno, mas versátil, conjunto de dados de deteção de objectos orientados, composto pelas primeiras 8 imagens de 8 imagens do conjunto DOTAv1 dividido, 4 para treino e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de deteção de objectos, ou para experimentar novas abordagens de deteção. Com 8 imagens, é suficientemente pequeno para ser facilmente gerível, mas suficientemente diversificado para testar os pipelines de treino quanto a erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.

Este conjunto de dados destina-se a ser utilizado com Ultralytics HUB e YOLO11.

Conjunto de dados YAML

Um ficheiro YAML (Yet Another Markup Language) é utilizado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos do conjunto de dados, classes e outras informações relevantes. No caso do conjunto de dados DOTA8, o ficheiro dota8.yaml é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilização

Para treinar um modelo YOLO11n-obb no conjunto de dados DOTA8 para 100 épocas com um tamanho de imagem de 640, pode utilizar os seguintes fragmentos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Exemplos de imagens e anotações

Aqui estão alguns exemplos de imagens do conjunto de dados DOTA8, juntamente com as anotações correspondentes:

Imagem de amostra do conjunto de dados

  • Imagem em mosaico: Esta imagem demonstra um lote de treino composto por imagens de conjuntos de dados em mosaico. O mosaico é uma técnica utilizada durante a formação que combina várias imagens numa única imagem para aumentar a variedade de objectos e cenas em cada lote de formação. Isto ajuda a melhorar a capacidade de generalização do modelo para diferentes tamanhos de objectos, proporções e contextos.

O exemplo mostra a variedade e complexidade das imagens no conjunto de dados DOTA8 e os benefícios da utilização de mosaicos durante o processo de formação.

Citações e agradecimentos

Se utilizar o conjunto de dados DOTA no seu trabalho de investigação ou desenvolvimento, cite o seguinte documento:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Uma nota especial de gratidão à equipa responsável pelos conjuntos de dados DOTA pelo seu esforço louvável na curadoria deste conjunto de dados. Para uma compreensão exaustiva do conjunto de dados e das suas nuances, visite o sítio Web oficial do DOTA.

FAQ

O que é o conjunto de dados DOTA8 e como pode ser utilizado?

O conjunto de dados DOTA8 é um pequeno e versátil conjunto de dados de deteção de objectos orientado, constituído pelas primeiras 8 imagens do conjunto dividido DOTAv1, com 4 imagens designadas para treino e 4 para validação. É ideal para testar e depurar modelos de deteção de objectos como Ultralytics YOLO11 . Devido ao seu tamanho e diversidade gerenciáveis, ajuda a identificar erros de pipeline e a executar verificações de sanidade antes de implantar conjuntos de dados maiores. Saiba mais sobre a deteção de objectos com Ultralytics YOLO11.

Como posso treinar um modelo YOLO11 utilizando o conjunto de dados DOTA8?

Para treinar um modelo YOLO11n-obb no conjunto de dados DOTA8 para 100 épocas com um tamanho de imagem de 640, pode utilizar os seguintes fragmentos de código. Para obter opções de argumentos abrangentes, consulte a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Quais são as principais caraterísticas do conjunto de dados DOTA e onde posso aceder ao ficheiro YAML?

O conjunto de dados DOTA é conhecido pela sua referência em grande escala e pelos desafios que apresenta para a deteção de objectos em imagens aéreas. O subconjunto DOTA8 é um conjunto de dados mais pequeno e manejável, ideal para testes iniciais. É possível aceder ao dota8.yaml que contém caminhos, classes e detalhes de configuração, neste Ligação GitHub.

Como é que o mosaico melhora o treino de modelos com o conjunto de dados DOTA8?

O mosaico combina várias imagens numa só durante o treino, aumentando a variedade de objectos e contextos em cada lote. Isto melhora a capacidade de generalização de um modelo para diferentes tamanhos de objectos, proporções e cenas. Esta técnica pode ser demonstrada visualmente através de um lote de treino composto por imagens do conjunto de dados DOTA8 em mosaico, ajudando no desenvolvimento de modelos robustos. Explore mais sobre mosaicos e técnicas de formação na nossa página Formação.

Por que razão devo utilizar Ultralytics YOLO11 para tarefas de deteção de objectos?

Ultralytics YOLO11 fornece capacidades de deteção de objectos em tempo real de última geração, incluindo caraterísticas como caixas delimitadoras orientadas (OBB), segmentação de instâncias e um pipeline de formação altamente versátil. É adequado para várias aplicações e oferece modelos pré-treinados para um ajuste fino eficiente. Saiba mais sobre as vantagens e a utilização na documentaçãoUltralytics YOLO11 .

📅C riado há 1 ano ✏️ Atualizado há 3 meses

Comentários