Rilevamento di oggetti con Oriented Bounding Boxes

Il rilevamento di oggetti orientati fa un passo avanti rispetto al rilevamento standard, introducendo un angolo extra per localizzare gli oggetti con maggiore precisione in un'immagine.

L'output di un rilevatore di oggetti orientati è un insieme di bounding box ruotati che racchiudono precisamente gli oggetti nell'immagine, insieme alle etichette di classe e ai punteggi di confidenza per ogni box. Gli oriented bounding boxes sono particolarmente utili quando gli oggetti appaiono ad angolazioni varie, come nelle immagini aeree, dove i tradizionali bounding box allineati agli assi potrebbero includere uno sfondo non necessario.

Suggerimento

I modelli YOLO26 OBB utilizzano il suffisso -obb, ad esempio yolo26n-obb.pt, e sono pre-addestrati su DOTAv1.



Watch: How to Detect & Track Objects with Ultralytics YOLO26 Oriented Bounding Boxes (OBB) | Ship Tracking 🚢

Esempi visivi

Rilevamento navi tramite OBBRilevamento veicoli tramite OBB
Rilevamento navi tramite OBBRilevamento veicoli tramite OBB

Modelli

Qui sono mostrati i modelli OBB pre-addestrati di YOLO26, che sono pre-addestrati sul dataset DOTAv1.

I modelli si scaricano automaticamente dall'ultima release di Ultralytics al primo utilizzo.

Modellodimensione
(pixel)
mAPtest
50-95(e2e)
mAPtest
50(e2e)
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLO26n-obb102452.478.997.7 ± 0.92.8 ± 0.02.514.0
YOLO26s-obb102454.880.9218.0 ± 1.44.9 ± 0.19.855.1
YOLO26m-obb102455.381.0579.2 ± 3.810.2 ± 0.321.2183.3
YOLO26l-obb102456.281.6735.6 ± 3.113.0 ± 0.225.6230.0
YOLO26x-obb102456.781.71485.7 ± 11.530.5 ± 0.957.6516.5
  • I valori mAPtest si riferiscono a modelli singoli multiscala sul dataset DOTAv1.
    Riproduci con yolo val obb data=DOTAv1.yaml device=0 split=test e invia i risultati uniti alla valutazione DOTA.
  • Velocità mediata su immagini di validazione DOTAv1 utilizzando un'istanza Amazon EC2 P4d.
    Riproduci con yolo val obb data=DOTAv1.yaml batch=1 device=0|cpu
  • I valori di Params e FLOPs si riferiscono al modello fuso dopo model.fuse(), che unisce i livelli Conv e BatchNorm e, per i modelli end2end, rimuove l'head di rilevamento ausiliario one-to-many. I checkpoint pre-addestrati mantengono l'architettura di addestramento completa e potrebbero mostrare conteggi più elevati.

Train

Addestra YOLO26n-obb sul dataset DOTA8 per 100 epoch con dimensione immagine 640. Per un elenco completo degli argomenti disponibili, consulta la pagina Configurazione.

Nota

Gli angoli OBB sono limitati all'intervallo 0–90 gradi (escluso il 90). Angoli di 90 gradi o superiori non sono supportati.

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.yaml")  # build a new model from YAML
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-obb.yaml").load("yolo26n-obb.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)


Watch: How to Train Ultralytics YOLO-OBB (Oriented Bounding Boxes) Models on DOTA Dataset using Ultralytics Platform

Formato del dataset

Il formato del dataset OBB è descritto in dettaglio nella Guida ai Dataset. Il formato YOLO OBB designa i bounding box tramite i loro quattro punti d'angolo con coordinate normalizzate tra 0 e 1, seguendo questa struttura. Ultralytics Platform supporta l'annotazione OBB con uno strumento dedicato per il disegno di oriented bounding box:

class_index x1 y1 x2 y2 x3 y3 x4 y4

Internamente, YOLO elabora le perdite e gli output nel formato xywhr, che rappresenta il punto centrale (xy), la larghezza, l'altezza e la rotazione del bounding box.

Val

Valida l'accuratezza del modello YOLO26n-obb addestrato sul dataset DOTA8. Non sono necessari argomenti poiché il model conserva i suoi data di addestramento e gli argomenti come attributi del modello.

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="dota8.yaml")  # no arguments needed, dataset and settings remembered
metrics.box.map  # map50-95(B)
metrics.box.map50  # map50(B)
metrics.box.map75  # map75(B)
metrics.box.maps  # a list containing mAP50-95(B) for each category
metrics.box.image_metrics  # per-image metrics dictionary with precision, recall, F1, TP, FP, and FN

Predict

Usa un modello YOLO26n-obb addestrato per eseguire previsioni sulle immagini.

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/boats.jpg")  # predict on an image

# Access the results
for result in results:
    xywhr = result.obb.xywhr  # center-x, center-y, width, height, angle (radians)
    xyxyxyxy = result.obb.xyxyxyxy  # polygon format with 4-points
    names = [result.names[cls.item()] for cls in result.obb.cls.int()]  # class name of each box
    confs = result.obb.conf  # confidence score of each box


Watch: How to Detect and Track Storage Tanks using Ultralytics YOLO-OBB | Oriented Bounding Boxes | DOTA

Vedi i dettagli completi della modalità predict nella pagina Previsione.

Export

Esporta un modello YOLO26n-obb in un formato diverso come ONNX, CoreML, ecc.

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom-trained model

# Export the model
model.export(format="onnx")

I formati di esportazione disponibili per YOLO26-obb sono elencati nella tabella sottostante. Puoi esportare in qualsiasi formato usando l'argomento format, ad esempio format='onnx' o format='engine'. Puoi eseguire previsioni o validazioni direttamente sui modelli esportati, ad esempio yolo predict model=yolo26n-obb.onnx. Gli esempi di utilizzo vengono mostrati per il tuo modello al termine dell'esportazione.

FormatoArgomento formatModelloMetadatiArgomenti
PyTorch-yolo26n-obb.pt-
TorchScripttorchscriptyolo26n-obb.torchscriptimgsz, half, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-obb.onnximgsz, half, dynamic, simplify, opset, nms, batch, device
OpenVINOopenvinoyolo26n-obb_openvino_model/imgsz, half, dynamic, int8, nms, batch, data, fraction, device
TensorRTengineyolo26n-obb.engineimgsz, half, dynamic, simplify, workspace, int8, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-obb.mlpackageimgsz, dynamic, half, int8, nms, batch, device
TF SavedModelsaved_modelyolo26n-obb_saved_model/imgsz, keras, int8, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-obb.pbimgsz, batch, device
TF Litetfliteyolo26n-obb.tfliteimgsz, half, int8, nms, batch, data, fraction, device
TF Edge TPUedgetpuyolo26n-obb_edgetpu.tfliteimgsz, int8, data, fraction, device
TF.jstfjsyolo26n-obb_web_model/imgsz, half, int8, nms, batch, data, fraction, device
PaddlePaddlepaddleyolo26n-obb_paddle_model/imgsz, batch, device
MNNmnnyolo26n-obb.mnnimgsz, batch, int8, half, device
NCNNncnnyolo26n-obb_ncnn_model/imgsz, half, batch, device
IMX500imxyolo26n-obb_imx_model/imgsz, int8, data, fraction, nms, device
RKNNrknnyolo26n-obb_rknn_model/imgsz, batch, name, device
ExecuTorchexecutorchyolo26n-obb_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-obb_axelera_model/imgsz, batch, int8, data, fraction, device
DeepXdeepxyolo26n-obb_deepx_model/imgsz, int8, data, optimize, device

Vedi i dettagli completi su export nella pagina Esportazione.

Applicazioni nel mondo reale

Il rilevamento OBB con YOLO26 ha numerose applicazioni pratiche in vari settori:

  • Gestione marittima e portuale: Rilevamento di navi e imbarcazioni ad angolazioni varie per la gestione della flotta e il monitoraggio.
  • Pianificazione urbana: Analisi di edifici e infrastrutture da immagini aeree.
  • Agricoltura: Monitoraggio di colture e attrezzature agricole da riprese di droni.
  • Settore energetico: Ispezione di pannelli solari e turbine eoliche con diverse orientazioni.
  • Trasporti: Tracciamento di veicoli su strade e parcheggi da varie prospettive.

Queste applicazioni traggono vantaggio dalla capacità dell'OBB di adattarsi con precisione agli oggetti ad ogni angolazione, fornendo un rilevamento più accurato rispetto ai tradizionali bounding box.

FAQ

Cosa sono gli Oriented Bounding Boxes (OBB) e in cosa differiscono dai normali bounding box?

Gli Oriented Bounding Boxes (OBB) includono un angolo aggiuntivo per migliorare la precisione della localizzazione degli oggetti nelle immagini. A differenza dei normali bounding box, che sono rettangoli allineati agli assi, gli OBB possono ruotare per adattarsi meglio all'orientamento dell'oggetto. Ciò è particolarmente utile per le applicazioni che richiedono un posizionamento preciso degli oggetti, come immagini aeree o satellitari (Guida ai Dataset).

Come posso addestrare un modello YOLO26n-obb utilizzando un dataset personalizzato?

Per addestrare un modello YOLO26n-obb con un dataset personalizzato, segui l'esempio seguente utilizzando Python o CLI:

Esempio
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-obb.pt")

# Train the model
results = model.train(data="path/to/custom_dataset.yaml", epochs=100, imgsz=640)

Per ulteriori argomenti di addestramento, consulta la sezione Configurazione.

Quali dataset posso utilizzare per l'addestramento dei modelli YOLO26-OBB?

I modelli YOLO26-OBB sono pre-addestrati su dataset come DOTAv1, ma puoi usare qualsiasi dataset formattato per OBB. Informazioni dettagliate sui formati dei dataset OBB si trovano nella Guida ai Dataset.

Come posso esportare un modello YOLO26-OBB nel formato ONNX?

Esportare un modello YOLO26-OBB nel formato ONNX è semplice utilizzando Python o CLI:

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Export the model
model.export(format="onnx")

Per ulteriori formati di esportazione e dettagli, consulta la pagina Esportazione.

Come posso validare l'accuratezza di un modello YOLO26n-obb?

Per validare un modello YOLO26n-obb, puoi usare Python o i comandi CLI come mostrato di seguito:

Esempio
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")

# Validate the model
metrics = model.val(data="dota8.yaml")

Vedi i dettagli completi sulla validazione nella sezione Val.

Commenti