Caixas delimitadoras orientadas para Detecção de Objetos

A detecção de objetos orientados vai um passo além da detecção de objetos padrão, introduzindo um ângulo extra para localizar objetos com maior precisão em uma imagem.

A saída de um detector de objetos orientados é um conjunto de caixas delimitadoras rotacionadas que envolvem precisamente os objetos na imagem, juntamente com rótulos de classe e pontuações de confiança para cada caixa. As caixas delimitadoras orientadas são particularmente úteis quando os objetos aparecem em vários ângulos, como em imagens aéreas, onde as caixas delimitadoras tradicionais alinhadas aos eixos podem incluir fundo desnecessário.

Dica

Os modelos YOLO26 OBB usam o sufixo -obb, por exemplo, yolo26n-obb.pt, e são pré-treinados no DOTAv1.



Watch: How to Detect & Track Objects with Ultralytics YOLO26 Oriented Bounding Boxes (OBB) | Ship Tracking 🚢

Exemplos Visuais

Detecção de Navios usando OBBDetecção de Veículos usando OBB
Detecção de Navios usando OBBDetecção de Veículos usando OBB

Modelos

Os modelos OBB pré-treinados do YOLO26 são mostrados aqui, os quais são pré-treinados no conjunto de dados DOTAv1.

Os Modelos são baixados automaticamente da versão mais recente da Ultralytics no primeiro uso.

Modelotamanho
(pixels)
mAPtest
50-95(e2e)
mAPtest
50(e2e)
Velocidade
CPU ONNX
(ms)
Velocidade
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n-obb102452.478.997.7 ± 0.92.8 ± 0.02.514.0
YOLO26s-obb102454.880.9218.0 ± 1.44.9 ± 0.19.855.1
YOLO26m-obb102455.381.0579.2 ± 3.810.2 ± 0.321.2183.3
YOLO26l-obb102456.281.6735.6 ± 3.113.0 ± 0.225.6230.0
YOLO26x-obb102456.781.71485.7 ± 11.530.5 ± 0.957.6516.5
  • Os valores de mAPtest são para multiescala de modelo único no conjunto de dados DOTAv1.
    Reproduza com yolo val obb data=DOTAv1.yaml device=0 split=test e envie os resultados mesclados para a avaliação DOTA.
  • Velocidade média calculada sobre imagens de validação do DOTAv1 usando uma instância Amazon EC2 P4d.
    Reproduza com yolo val obb data=DOTAv1.yaml batch=1 device=0|cpu
  • Os valores de Params e FLOPs referem-se ao modelo fundido após model.fuse(), que mescla camadas Conv e BatchNorm e, para modelos de ponta a ponta (end2end), remove a cabeça de detecção auxiliar de um para muitos. Checkpoints pré-treinados mantêm a arquitetura de treinamento completa e podem exibir contagens mais altas.

Train

Treine o YOLO26n-obb no conjunto de dados DOTA8 por 100 épocas com tamanho de imagem 640. Para uma lista completa de argumentos disponíveis, veja a página de Configuração.

Nota

Os ângulos OBB são restringidos ao intervalo de 0–90 graus (exclusivo de 90). Ângulos de 90 graus ou mais não são suportados.

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.yaml")  # build a new model from YAML
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-obb.yaml").load("yolo26n-obb.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)


Watch: How to Train Ultralytics YOLO-OBB (Oriented Bounding Boxes) Models on DOTA Dataset using Ultralytics Platform

Formato do conjunto de dados

O formato de conjunto de dados OBB pode ser encontrado em detalhes no Guia de Conjuntos de Dados. O formato YOLO OBB designa caixas delimitadoras pelos seus quatro pontos de canto com coordenadas normalizadas entre 0 e 1, seguindo esta estrutura. A Plataforma Ultralytics suporta anotação OBB com uma ferramenta dedicada de desenho de caixa delimitadora orientada:

class_index x1 y1 x2 y2 x3 y3 x4 y4

Internamente, o YOLO processa perdas e saídas no formato xywhr, que representa o ponto central (xy), largura, altura e rotação da caixa delimitadora.

Val

Valide a precisão do modelo YOLO26n-obb treinado no conjunto de dados DOTA8. Nenhum argumento é necessário, pois o model retém seus dados de treinamento data e argumentos como atributos do modelo.

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="dota8.yaml")  # no arguments needed, dataset and settings remembered
metrics.box.map  # map50-95(B)
metrics.box.map50  # map50(B)
metrics.box.map75  # map75(B)
metrics.box.maps  # a list containing mAP50-95(B) for each category
metrics.box.image_metrics  # per-image metrics dictionary with precision, recall, F1, TP, FP, and FN

Prever

Use um modelo YOLO26n-obb treinado para executar predições em imagens.

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/boats.jpg")  # predict on an image

# Access the results
for result in results:
    xywhr = result.obb.xywhr  # center-x, center-y, width, height, angle (radians)
    xyxyxyxy = result.obb.xyxyxyxy  # polygon format with 4-points
    names = [result.names[cls.item()] for cls in result.obb.cls.int()]  # class name of each box
    confs = result.obb.conf  # confidence score of each box


Watch: How to Detect and Track Storage Tanks using Ultralytics YOLO-OBB | Oriented Bounding Boxes | DOTA

Veja detalhes completos do modo predict na página Predição.

Export

Exporte um modelo YOLO26n-obb para um formato diferente como ONNX, CoreML, etc.

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

Os formatos de exportação disponíveis para YOLO26-obb estão na tabela abaixo. Você pode exportar para qualquer formato usando o argumento format, por exemplo, format='onnx' ou format='engine'. Você pode prever ou validar diretamente em modelos exportados, por exemplo, yolo predict model=yolo26n-obb.onnx. Exemplos de uso são mostrados para o seu modelo após a conclusão da exportação.

FormatoArgumento formatModeloMetadadosArgumentos
PyTorch-yolo26n-obb.pt-
TorchScripttorchscriptyolo26n-obb.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-obb.onnximgsz, half, dynamic, simplify, opset, nms, batch, device
OpenVINOopenvinoyolo26n-obb_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n-obb.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-obb.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n-obb_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-obb.pbimgsz, batch, device
TF Litetfliteyolo26n-obb.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-obb_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n-obb_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-obb_paddle_model/imgsz, batch, device
MNNmnnyolo26n-obb.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n-obb_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n-obb_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n-obb_rknn_model/imgsz, batch, name, device
ExecuTorchexecutorchyolo26n-obb_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-obb_axelera_model/imgsz, batch, int8, data, fraction, device
DeepXdeepxyolo26n-obb_deepx_model/imgsz, int8, data, optimize, device

Consulta os detalhes completos de export na página Export.

Aplicações do Mundo Real

A detecção OBB com YOLO26 tem inúmeras aplicações práticas em várias indústrias:

  • Gestão Marítima e Portuária: Detectando navios e embarcações em vários ângulos para gestão de frota e monitoramento.
  • Planejamento Urbano: Analisando edifícios e infraestrutura a partir de imagens aéreas.
  • Agricultura: Monitorando plantações e equipamentos agrícolas a partir de filmagens de drones.
  • Setor de Energia: Inspecionando painéis solares e turbinas eólicas em diferentes orientações.
  • Transporte: Rastreando veículos em estradas e estacionamentos a partir de várias perspectivas.

Essas aplicações se beneficiam da capacidade do OBB de se ajustar precisamente aos objetos em qualquer ângulo, fornecendo uma detecção mais precisa do que as caixas delimitadoras tradicionais.

FAQ

O que são Caixas Delimitadoras Orientadas (OBB) e como elas diferem das caixas delimitadoras regulares?

As Caixas Delimitadoras Orientadas (OBB) incluem um ângulo adicional para melhorar a precisão da localização de objetos em imagens. Diferente das caixas delimitadoras regulares, que são retângulos alinhados aos eixos, as OBBs podem rotacionar para se ajustar melhor à orientação do objeto. Isso é particularmente útil para aplicações que exigem posicionamento preciso de objetos, como imagens aéreas ou de satélite (Guia de Conjuntos de Dados).

Como treino um modelo YOLO26n-obb usando um conjunto de dados personalizado?

Para treinar um modelo YOLO26n-obb com um conjunto de dados personalizado, siga o exemplo abaixo usando Python ou CLI:

Exemplo
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-obb.pt")

# Train the model
results = model.train(data="path/to/custom_dataset.yaml", epochs=100, imgsz=640)

Para mais argumentos de treinamento, confira a seção de Configuração.

Quais conjuntos de dados posso usar para treinar modelos YOLO26-OBB?

Modelos YOLO26-OBB são pré-treinados em conjuntos de dados como DOTAv1, mas você pode usar qualquer conjunto de dados formatado para OBB. Informações detalhadas sobre formatos de conjuntos de dados OBB podem ser encontradas no Guia de Conjuntos de Dados.

Como posso exportar um modelo YOLO26-OBB para o formato ONNX?

Exportar um modelo YOLO26-OBB para o formato ONNX é direto usando Python ou CLI:

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Export the model
model.export(format="onnx")

Para mais formatos de exportação e detalhes, consulte a página de Exportação.

Como valido a precisão de um modelo YOLO26n-obb?

Para validar um modelo YOLO26n-obb, você pode usar comandos Python ou CLI como mostrado abaixo:

Exemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Validate the model
metrics = model.val(data="dota8.yaml")

Veja detalhes completos de validação na seção Val.

Comentários