Conjunto de dados DOTA128
Introdução
Ultralytics O DOTA128 é um conjunto de dados pequeno, mas versátil, orientado para a detecção de objetos, composto por 128 imagens do conjunto DOTAv1, 128 para treino e validação. Este conjunto de dados é ideal para testar e depurar modelos orientados para caixas delimitadoras (OBB) ou para experimentar novas abordagens de detecção. Com 128 imagens, é pequeno o suficiente para ser facilmente gerenciável, mas diversificado o suficiente para testar pipelines de treinamento em busca de erros e atuar como uma verificação de sanidade antes de treinar conjuntos de dados maiores.
Estrutura do Conjunto de Dados
- Imagens: 128 mosaicos aéreos (todos na pasta «train», usados tanto para comboios como para val) provenientes do DOTAv1.
- Classes: Herda as 15 categorias DOTAv1, como avião, navio e veículo grande.
- Rótulos: Caixas delimitadoras orientadas no formato YOLO salvas como
.txtarquivos ao lado de cada imagem.
Este conjunto de dados destina-se ao uso com a Plataforma Ultralytics e YOLO26.
YAML do Conjunto de Dados
Um ficheiro YAML (Yet Another Markup Language) é usado para definir a configuração do conjunto de dados. Ele contém informações sobre os caminhos, classes e outras informações relevantes do conjunto de dados. No caso do conjunto de dados DOTA128, o dota128.yaml arquivo é mantido em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip
Utilização
Para treinar umobb no conjunto de dados DOTA128 por 100 épocas com um tamanho de imagem de 640, pode usar os seguintes trechos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulte a página Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Amostras de Imagens e Anotações
Aqui estão alguns exemplos de imagens do conjunto de dados DOTA128, juntamente com as suas anotações correspondentes:

- Imagem em Mosaico: Esta imagem demonstra um lote de treinamento composto por imagens de conjunto de dados em mosaico. O mosaico é uma técnica usada durante o treinamento que combina várias imagens em uma única imagem para aumentar a variedade de objetos e cenas dentro de cada lote de treinamento. Isso ajuda a melhorar a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e contextos.
O exemplo mostra a variedade e complexidade das imagens no conjunto de dados DOTA128 e os benefícios de usar mosaicos durante o processo de treino.
Citações e Agradecimentos
Se você usar o conjunto de dados DOTA em seu trabalho de pesquisa ou desenvolvimento, por favor, cite o seguinte artigo:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
Uma nota especial de gratidão à equipe por trás dos conjuntos de dados DOTA por seu esforço louvável na curadoria deste conjunto de dados. Para uma compreensão exaustiva do conjunto de dados e suas nuances, visite o site oficial do DOTA.
FAQ
O que é o conjunto de dados DOTA128 e como pode ser utilizado?
O conjunto de dados DOTA128 é um conjunto de dados versátil orientado para a deteção de objetos, composto por 128 imagens do conjunto DOTAv1, todas armazenadas na pasta train. Tanto o treino como a validação utilizam o mesmo conjunto de imagens, tornando-o ideal para testes rápidos e fluxos de trabalho de depuração. É ideal para testar e depurar modelos OBB como Ultralytics . Devido ao seu tamanho gerenciável e diversidade, ele ajuda a identificar erros no pipeline e a executar verificações de sanidade antes de implantar conjuntos de dados maiores. Saiba mais sobre a detecção OBB com Ultralytics .
Como treinar um modelo YOLO26 usando o conjunto de dados DOTA128?
Para treinar umobb no conjunto de dados DOTA128 por 100 épocas com um tamanho de imagem de 640, pode usar os seguintes trechos de código. Para opções de argumentos abrangentes, consulte a página Treinamento do modelo.
Exemplo de Treinamento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
Quais são as principais características do conjunto de dados DOTA e onde posso acessar o arquivo YAML?
O conjunto de dados DOTA é conhecido pelo seu benchmark em grande escala e pelos desafios que apresenta para a deteção de objetos em imagens aéreas. O subconjunto DOTA128 oferece mais diversidade do que o DOTA8, mantendo-se acessível para testes iniciais. Pode aceder ao dota128.yaml ficheiro, que contém caminhos, classes e detalhes de configuração, neste Link do GitHub.
Como o DOTA128 se compara a outras variantes do conjunto de dados DOTA?
O DOTA128 (128 imagens) situa-se entre o DOTA8 (8 imagens) e o conjunto de dados completo DOTA-v1 (1.869 imagens) em termos de tamanho:
- DOTA8: Contém apenas 8 imagens (4 comboio, 4 val) - ideal para testes rápidos e depuração
- DOTA128: Contém 128 imagens (todas na pasta train, usadas tanto para treinamento quanto para validação) - equilíbrio entre tamanho e diversidade
- DOTA-v1 completo: contém 1.869 imagens - abrangente, mas consome muitos recursos
O DOTA128 oferece um bom meio-termo, proporcionando mais diversidade do que o DOTA8, mas permanecendo muito mais gerenciável do que o conjunto de dados completo do DOTA para experimentação e desenvolvimento inicial de modelos.
Como o mosaico melhora o treino do modelo com o conjunto de dados DOTA128?
O mosaico combina várias imagens numa só durante o treino, aumentando a variedade de objetos e contextos em cada lote. Isso melhora a capacidade do modelo de generalizar para diferentes tamanhos de objetos, proporções e cenas. Essa técnica pode ser demonstrada visualmente por meio de um lote de treino composto por imagens do conjunto de dados DOTA128 em mosaico, ajudando no desenvolvimento robusto do modelo. Explore mais sobre mosaicos e técnicas de treino na nossa página Treino.
Por que devo usar Ultralytics para tarefas de deteção de objetos orientadas?
Ultralytics YOLO26 oferece capacidades de detecção de objetos em tempo real de última geração, incluindo recursos como caixas delimitadoras orientadas (OBB), segmentação de instância e um pipeline de treinamento altamente versátil. É adequado para diversas aplicações e oferece modelos pré-treinados para um ajuste fino eficiente. Explore mais sobre as vantagens e o uso na documentação do Ultralytics YOLO26.