Ir para o conteúdo

Conjunto de Dados DOTA8

Introdução

Ultralytics DOTA8 é um conjunto de dados pequeno, porém versátil, de detecção de objetos orientados, composto pelas primeiras 8 imagens do conjunto DOTAv1 dividido, 4 para treinamento e 4 para validação. Este conjunto de dados é ideal para testar e depurar modelos de detecção de objetos ou para experimentar novas abordagens de detecção. Com 8 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diverso o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.

Estrutura do Conjunto de Dados

  • Imagens: 8 tiles aéreos (4 de treino, 4 de validação) provenientes de DOTAv1.
  • Classes: Herda as 15 categorias DOTAv1, como avião, navio e veículo grande.
  • Rótulos: Caixas delimitadoras orientadas no formato YOLO salvas como .txt arquivos ao lado de cada imagem.
  • Layout recomendado:

    datasets/dota8/
    ├── images/
    │   ├── train/
    │   └── val/
    └── labels/
        ├── train/
        └── val/
    

Este conjunto de dados destina-se ao uso com a Plataforma Ultralytics e YOLO26.

YAML do Conjunto de Dados

Um arquivo YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados DOTA8, o dota8.yaml arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Utilização

Para treinar um modelo YOLO26n-obb no conjunto de dados DOTA8 por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Amostras de Imagens e Anotações

Aqui estão alguns exemplos de imagens do conjunto de dados DOTA8, juntamente com suas anotações correspondentes:

Mosaico de treino de conjunto de dados de caixas delimitadoras orientadas para DOTA8

  • Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.

O exemplo demonstra a variedade e complexidade das imagens no conjunto de dados DOTA8 e os benefícios de usar mosaicos durante o processo de treinamento.

Citações e Agradecimentos

Se você usar o conjunto de dados DOTA em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Uma nota especial de gratidão à equipe por trás dos conjuntos de dados DOTA por seu esforço louvável na curadoria deste conjunto de dados. Para uma compreensão exaustiva do conjunto de dados e suas nuances, visite o site oficial do DOTA.

FAQ

O que é o conjunto de dados DOTA8 e como ele pode ser usado?

O conjunto de dados DOTA8 é um conjunto de dados de detecção de objetos orientados pequeno e versátil, composto pelas primeiras 8 imagens do conjunto de divisão DOTAv1, com 4 imagens designadas para treinamento e 4 para validação. É ideal para testar e depurar modelos de detecção de objetos como o Ultralytics YOLO26. Devido ao seu tamanho gerenciável e diversidade, ele ajuda na identificação de erros de pipeline e na execução de verificações de sanidade antes de implantar conjuntos de dados maiores. Saiba mais sobre detecção de objetos com Ultralytics YOLO26.

Como faço para treinar um modelo YOLO26 usando o conjunto de dados DOTA8?

Para treinar um modelo YOLO26n-obb no conjunto de dados DOTA8 por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para opções de argumentos abrangentes, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Quais são as principais características do conjunto de dados DOTA e onde posso acessar o arquivo YAML?

O conjunto de dados DOTA é conhecido por seu benchmark em grande escala e pelos desafios que apresenta para a detecção de objetos em imagens aéreas. O subconjunto DOTA8 é um conjunto de dados menor e gerenciável, ideal para testes iniciais. Você pode acessar o dota8.yaml ficheiro, que contém caminhos, classes e detalhes de configuração, neste Link do GitHub.

Como o mosaicing aprimora o treinamento do modelo com o conjunto de dados DOTA8?

O mosaico combina várias imagens em uma durante o treinamento, aumentando a variedade de objetos e contextos dentro de cada lote. Isso melhora a capacidade de um modelo de generalizar para diferentes tamanhos de objetos, proporções e cenas. Essa técnica pode ser demonstrada visualmente através de um lote de treinamento composto por imagens do conjunto de dados DOTA8 em mosaico, auxiliando no desenvolvimento de um modelo robusto. Explore mais sobre mosaico e técnicas de treinamento em nossa página de Treinamento.

Por que devo usar o Ultralytics YOLO26 para tarefas de detecção de objetos?

Ultralytics YOLO26 oferece capacidades de detecção de objetos em tempo real de última geração, incluindo recursos como caixas delimitadoras orientadas (OBB), segmentação de instância e um pipeline de treinamento altamente versátil. É adequado para diversas aplicações e oferece modelos pré-treinados para um ajuste fino eficiente. Explore mais sobre as vantagens e o uso na documentação do Ultralytics YOLO26.



📅 Criado há 2 anos ✏️ Atualizado há 7 dias
glenn-jocherUltralyticsAssistantMatthewNoyceRizwanMunawarLaughing-q

Comentários