Conjunto de Dados DOTA128

Q: What is the DOTA128 dataset and how can it be used?

O dataset DOTA128 é um dataset versátil para detecção de objetos orientados, composto por 128 imagens do conjunto DOTAv1, todas armazenadas na pasta train. Tanto o treinamento quanto a validação usam o mesmo conjunto de imagens, tornando-o ideal para testes rápidos e fluxos de trabalho de depuração. É ideal para testar e depurar modelos OBB como o Ultralytics YOLO26. Devido ao seu tamanho gerenciável e diversidade, ele ajuda na identificação de erros de pipeline e na execução de verificações de sanidade antes de implantar datasets maiores. Saiba mais sobre a detecção OBB com Ultralytics YOLO26.

Introdução

Ultralytics DOTA128 é um conjunto de dados de detecção de objetos orientados pequeno, mas versátil, composto por 128 imagens do conjunto DOTAv1, 128 para treinamento e validação. Este conjunto de dados é ideal para testar e depurar modelos de caixas delimitadoras orientadas (OBB), ou para experimentar novas abordagens de detecção. Com 128 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diversificado o suficiente para testar pipelines de treinamento em busca de erros e servir como uma verificação de sanidade antes de treinar conjuntos de dados maiores.

Estrutura do Conjunto de Dados

Imagens: 128 tiles aéreos (todos na pasta de treino, usados para treino e validação) provenientes do DOTAv1.
Classes: Herda as 15 categorias DOTAv1, como avião, navio e veículo grande.
Rótulos: Caixas delimitadoras orientadas no formato YOLO salvas como .txt arquivos ao lado de cada imagem.

Este conjunto de dados destina-se ao uso com a Plataforma Ultralytics e YOLO26.

YAML do Conjunto de Dados

Um arquivo yaml (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados DOTA128, o dota128.yaml arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Utilização

Para treinar um modelo YOLO26n-obb no conjunto de dados DOTA128 por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para uma lista abrangente de argumentos disponíveis, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Amostras de Imagens e Anotações

Aqui estão alguns exemplos de imagens do conjunto de dados DOTA128, juntamente com suas anotações correspondentes:

Mosaico de treinamento do conjunto de dados de caixas delimitadoras orientadas DOTA128

Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.

O exemplo demonstra a variedade e complexidade das imagens no conjunto de dados DOTA128 e os benefícios do uso de mosaicing durante o processo de treinamento.

Citações e Agradecimentos

Se você usar o conjunto de dados DOTA em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:

BibTeX

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Uma nota especial de gratidão à equipe por trás dos conjuntos de dados DOTA por seu esforço louvável na curadoria deste conjunto de dados. Para uma compreensão exaustiva do conjunto de dados e suas nuances, visite o site oficial do DOTA.

FAQ

O que é o dataset DOTA128 e como ele pode ser utilizado?

O conjunto de dados DOTA128 é um conjunto de dados versátil para detecção de objetos orientados, composto por 128 imagens do conjunto DOTAv1, todas armazenadas na pasta train. Tanto o treinamento quanto a validação utilizam o mesmo conjunto de imagens, tornando-o ideal para fluxos de trabalho rápidos de teste e depuração. É ideal para testar e depurar modelos OBB como o Ultralytics YOLO26. Devido ao seu tamanho gerenciável e diversidade, ajuda a identificar erros de pipeline e a realizar verificações de sanidade antes de implantar conjuntos de dados maiores. Saiba mais sobre a detecção OBB com Ultralytics YOLO26.

Como treino um modelo YOLO26 usando o conjunto de dados DOTA128?

Para treinar um modelo YOLO26n-obb no conjunto de dados DOTA128 por 100 épocas com um tamanho de imagem de 640, você pode usar os seguintes trechos de código. Para opções abrangentes de argumentos, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Quais são as principais características do conjunto de dados DOTA e onde posso acessar o arquivo YAML?

O dataset DOTA é conhecido por seu benchmark em larga escala e pelos desafios que apresenta para a detecção de objetos em imagens aéreas. O subconjunto DOTA128 oferece mais diversidade que o DOTA8, mantendo-se gerenciável para testes iniciais. Você pode acessar o dota128.yaml ficheiro, que contém caminhos, classes e detalhes de configuração, neste Link do GitHub.

Como o DOTA128 se compara a outras variantes do conjunto de dados DOTA?

DOTA128 (128 imagens) situa-se entre DOTA8 (8 imagens) e o conjunto de dados completo DOTA-v1 (1.869 imagens) em termos de tamanho:

DOTA8: Contém apenas 8 imagens (4 para treino, 4 para validação) - ideal para testes rápidos e depuração
DOTA128: Contém 128 imagens (todas na pasta de treino, usadas para treino e validação) - equilibrado entre tamanho e diversidade
DOTA-v1 Completo: Contém 1.869 imagens - abrangente, mas intensivo em recursos

DOTA128 oferece um bom meio-termo, proporcionando mais diversidade do que DOTA8, ao mesmo tempo que é muito mais gerenciável do que o conjunto de dados DOTA completo para experimentação e desenvolvimento inicial de modelos.

Como a técnica de mosaico aprimora o treinamento de modelos com o conjunto de dados DOTA128?

A técnica de mosaico combina múltiplas imagens em uma durante o treinamento, aumentando a variedade de objetos e contextos dentro de cada lote. Isso melhora a capacidade de um modelo de generalizar para diferentes tamanhos de objetos, proporções e cenas. Essa técnica pode ser visualmente demonstrada através de um lote de treinamento composto por imagens do conjunto de dados DOTA128 em mosaico, auxiliando no desenvolvimento de modelos robustos. Explore mais sobre técnicas de mosaico e treinamento em nossa página de Treinamento.

Por que devo usar o Ultralytics YOLO26 para tarefas de detect de objetos orientados?

Ultralytics YOLO26 oferece capacidades de detecção de objetos em tempo real de última geração, incluindo recursos como caixas delimitadoras orientadas (OBB), segmentação de instância e um pipeline de treinamento altamente versátil. É adequado para diversas aplicações e oferece modelos pré-treinados para um ajuste fino eficiente. Explore mais sobre as vantagens e o uso na documentação do Ultralytics YOLO26.

📅 Criado há 21 dias ✏️ Atualizado há 21 dias