Link to this sectionHộp bao định hướng Object Detection#
Phát hiện đối tượng định hướng tiến xa hơn một bước so với phát hiện đối tượng tiêu chuẩn bằng cách đưa thêm một góc bổ sung để định vị đối tượng trong ảnh chính xác hơn.
Đầu ra của bộ phát hiện đối tượng định hướng là tập hợp các hộp bao xoay được bao quanh chính xác các đối tượng trong ảnh, cùng với nhãn lớp và điểm tin cậy cho mỗi hộp. Các hộp bao định hướng đặc biệt hữu ích khi đối tượng xuất hiện ở nhiều góc độ khác nhau, chẳng hạn như trong ảnh chụp từ trên không, nơi các hộp bao thẳng hàng với trục truyền thống có thể chứa nhiều phần nền không cần thiết.
Các model YOLO26 OBB sử dụng hậu tố -obb, ví dụ: yolo26n-obb.pt, và được huấn luyện trước trên DOTAv1.
Watch: How to Detect & Track Objects with Ultralytics YOLO26 Oriented Bounding Boxes (OBB) | Ship Tracking 🚢
Link to this sectionMẫu hình ảnh trực quan#
| Phát hiện tàu thuyền sử dụng OBB | Phát hiện phương tiện sử dụng OBB |
|---|---|
![]() | ![]() |
Link to this sectionModel#
Các model OBB được huấn luyện trước YOLO26 được hiển thị tại đây, vốn đã được huấn luyện trước trên tập dữ liệu DOTAv1.
Các Models sẽ tự động tải xuống từ release mới nhất của Ultralytics ngay lần đầu sử dụng.
| Mô hình | kích thước (pixel) | mAPtest 50-95(e2e) | mAPtest 50(e2e) | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n-obb | 1024 | 52.4 | 78.9 | 97.7 ± 0.9 | 2.8 ± 0.0 | 2.5 | 14.0 |
| YOLO26s-obb | 1024 | 54.8 | 80.9 | 218.0 ± 1.4 | 4.9 ± 0.1 | 9.8 | 55.1 |
| YOLO26m-obb | 1024 | 55.3 | 81.0 | 579.2 ± 3.8 | 10.2 ± 0.3 | 21.2 | 183.3 |
| YOLO26l-obb | 1024 | 56.2 | 81.6 | 735.6 ± 3.1 | 13.0 ± 0.2 | 25.6 | 230.0 |
| YOLO26x-obb | 1024 | 56.7 | 81.7 | 1485.7 ± 11.5 | 30.5 ± 0.9 | 57.6 | 516.5 |
- Các giá trị mAPtest dành cho model đơn đa quy mô trên tập dữ liệu DOTAv1.
Tái lập bằngyolo val obb data=DOTAv1.yaml device=0 split=testvà gửi kết quả đã hợp nhất đến DOTA evaluation. - Tốc độ được tính trung bình trên các ảnh val DOTAv1 sử dụng instance Amazon EC2 P4d.
Tái lập bằngyolo val obb data=DOTAv1.yaml batch=1 device=0|cpu - Các giá trị Params và FLOPs dành cho model đã hợp nhất sau khi chạy
model.fuse(), giúp gộp các lớp Conv và BatchNorm, và đối với các model end2end, sẽ loại bỏ đầu ra detection một-nhiều phụ trợ. Các checkpoint tiền huấn luyện giữ lại kiến trúc huấn luyện đầy đủ và có thể hiển thị số lượng cao hơn.
Link to this sectionHuấn luyện (Train)#
Huấn luyện YOLO26n-obb trên tập dữ liệu DOTA8 trong 100 epochs với kích thước ảnh 640. Để xem danh sách đầy đủ các tham số khả dụng, hãy xem trang Cấu hình.
Một OBB và bản xoay 180° của nó là giống nhau, vì vậy góc xoay được xác định theo modulo 180° và hộp không có hướng. Ở bên trong, góc được lưu trữ bằng radian và chuẩn hóa về [-π/4, 3π/4) ([-45°, 135°)), chiều rộng hộp w được lấy là cạnh dài hơn, và góc được định nghĩa là góc quay theo chiều kim đồng hồ từ trục x dương đến hướng của w. Dạng [0°, 90°) là quy ước kiểu DOTA đã được chuẩn hóa và không được áp dụng trong quá trình huấn luyện hoặc suy luận.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.yaml") # build a new model from YAML
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
model = YOLO("yolo26n-obb.yaml").load("yolo26n-obb.pt") # build from YAML and transfer weights
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)Watch: How to Train Ultralytics YOLO-OBB (Oriented Bounding Boxes) Models on DOTA Dataset using Ultralytics Platform
Link to this sectionĐịnh dạng tập dữ liệu#
Định dạng tập dữ liệu OBB có thể được tìm thấy chi tiết trong Hướng dẫn về Tập dữ liệu. Định dạng YOLO OBB chỉ định các hộp bao theo bốn điểm góc với tọa độ được chuẩn hóa từ 0 đến 1, tuân theo cấu trúc này. Ultralytics Platform hỗ trợ chú thích OBB với công cụ vẽ hộp bao định hướng chuyên dụng:
class_index x1 y1 x2 y2 x3 y3 x4 y4
Ở bên trong, YOLO xử lý các hàm mất mát và đầu ra theo định dạng xywhr, biểu thị điểm trung tâm (xy), chiều rộng, chiều cao và góc xoay của bounding box.
Link to this sectionVal#
Xác thực độ chính xác của model YOLO26n-obb đã huấn luyện trên tập dữ liệu DOTA8. Không cần đối số vì model vẫn giữ lại các thuộc tính data và các tham số từ quá trình huấn luyện.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Validate the model
metrics = model.val(data="dota8.yaml") # no arguments needed, dataset and settings remembered
metrics.box.map # map50-95(B)
metrics.box.map50 # map50(B)
metrics.box.map75 # map75(B)
metrics.box.maps # a list containing mAP50-95(B) for each category
metrics.box.image_metrics # per-image metrics dictionary with precision, recall, F1, TP, FP, and FNLink to this sectionDự đoán (Predict)#
Sử dụng model YOLO26n-obb đã huấn luyện để chạy dự đoán trên hình ảnh.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom model
# Predict with the model
results = model("https://ultralytics.com/images/boats.jpg") # predict on an image
# Access the results
for result in results:
xywhr = result.obb.xywhr # center-x, center-y, width, height, angle (radians)
xyxyxyxy = result.obb.xyxyxyxy # polygon format with 4-points
names = [result.names[cls.item()] for cls in result.obb.cls.int()] # class name of each box
confs = result.obb.conf # confidence score of each boxWatch: How to Detect and Track Storage Tanks using Ultralytics YOLO-OBB | Oriented Bounding Boxes | DOTA
Xem chi tiết đầy đủ về chế độ predict trong trang Dự đoán.
Link to this sectionĐầu ra kết quả#
Phát hiện hộp bao định hướng trả về một đối tượng Results cho mỗi ảnh. Trường dự đoán chính là result.obb, chứa các hộp đã xoay, ID lớp và điểm tin cậy cho mỗi đối tượng được phát hiện.
| Thuộc tính | Loại | Kích thước | Mô tả |
|---|---|---|---|
result.obb | OBB | (N) | Các khung hình định hướng (Oriented boxes). |
result.obb.data | torch.float32 | (N,7/8) | Dữ liệu thô của các khung hình xoay kèm độ tin cậy/lớp. |
result.obb.xywhr | torch.float32 | (N,5) | Các khung hình xoay xywhr. |
result.obb.xyxyxyxy | torch.float32 | (N,4,2) | Bốn điểm góc. |
result.obb.conf | torch.float32 | (N,) | Điểm độ tin cậy. |
Để biết các trường Results cụ thể cho từng tác vụ, hãy xem phần Dự đoán kết quả theo tác vụ.
Link to this sectionXuất (Export)#
Xuất model YOLO26n-obb sang một định dạng khác như ONNX, CoreML, v.v.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load an official model
model = YOLO("path/to/best.pt") # load a custom-trained model
# Export the model
model.export(format="onnx")Các định dạng xuất YOLO26-obb khả dụng được liệt kê trong bảng dưới đây. Bạn có thể xuất sang bất kỳ định dạng nào bằng cách sử dụng tham số format, ví dụ: format='onnx' hoặc format='engine'. Bạn có thể dự đoán hoặc xác thực trực tiếp trên các model đã xuất, ví dụ: yolo predict model=yolo26n-obb.onnx. Các ví dụ về cách sử dụng sẽ được hiển thị cho model của bạn sau khi quá trình xuất hoàn tất.
| Định dạng | Tham số format | Mô hình | Metadata | Tham số |
|---|---|---|---|---|
| PyTorch | - | yolo26n-obb.pt | ✅ | - |
| TorchScript | torchscript | yolo26n-obb.torchscript | ✅ | imgsz, quantize, dynamic, optimize, nms, batch, device |
| ONNX | onnx | yolo26n-obb.onnx | ✅ | imgsz, quantize, dynamic, simplify, opset, nms, batch, data, fraction, device |
| OpenVINO | openvino | yolo26n-obb_openvino_model/ | ✅ | imgsz, quantize, dynamic, nms, batch, data, fraction, device |
| TensorRT | engine | yolo26n-obb.engine | ✅ | imgsz, quantize, dynamic, simplify, workspace, nms, batch, data, fraction, device |
| CoreML | coreml | yolo26n-obb.mlpackage | ✅ | imgsz, dynamic, quantize, nms, batch, device |
| TF SavedModel | saved_model | yolo26n-obb_saved_model/ | ✅ | imgsz, keras, quantize, nms, batch, data, fraction, device |
| TF GraphDef | pb | yolo26n-obb.pb | ❌ | imgsz, batch, device |
| TF Edge TPU | edgetpu | yolo26n-obb_edgetpu.tflite | ✅ | imgsz, quantize, data, fraction, device |
| PaddlePaddle | paddle | yolo26n-obb_paddle_model/ | ✅ | imgsz, batch, device |
| MNN | mnn | yolo26n-obb.mnn | ✅ | imgsz, batch, quantize, device |
| NCNN | ncnn | yolo26n-obb_ncnn_model/ | ✅ | imgsz, quantize, batch, device |
| IMX500 | imx | yolo26n-obb_imx_model/ | ✅ | imgsz, quantize, data, fraction, nms, device |
| RKNN | rknn | yolo26n-obb_rknn_model/ | ✅ | imgsz, batch, name, quantize, data, fraction, device |
| ExecuTorch | executorch | yolo26n-obb_executorch_model/ | ✅ | imgsz, batch, device |
| Axelera | axelera | yolo26n-obb_axelera_model/ | ✅ | imgsz, batch, quantize, data, fraction, device |
| DEEPX | deepx | yolo26n-obb_deepx_model/ | ✅ | imgsz, quantize, data, optimize, device |
| Qualcomm QNN | qnn | yolo26n-obb_qnn.onnx | ✅ | imgsz, batch, name, quantize, data, fraction, device |
| LiteRT | litert | yolo26n-obb.tflite | ✅ | imgsz, quantize, batch, data, fraction, device |
Xem chi tiết export đầy đủ trong trang Export.
Link to this sectionỨng dụng trong thực tế#
Phát hiện OBB với YOLO26 có nhiều ứng dụng thực tiễn trong nhiều ngành công nghiệp khác nhau:
- Quản lý Hàng hải và Cảng biển: Phát hiện tàu thuyền và phương tiện ở các góc độ khác nhau để phục vụ quản lý đội tàu và giám sát.
- Quy hoạch Đô thị: Phân tích các tòa nhà và cơ sở hạ tầng từ ảnh chụp trên không.
- Nông nghiệp: Giám sát cây trồng và thiết bị nông nghiệp từ dữ liệu quay từ drone.
- Ngành Năng lượng: Kiểm tra các tấm pin năng lượng mặt trời và tuabin gió ở các hướng khác nhau.
- Giao thông vận tải: Theo dõi phương tiện trên đường và trong bãi đỗ xe từ nhiều góc nhìn khác nhau.
Những ứng dụng này được hưởng lợi từ khả năng của OBB trong việc bao khớp chính xác các đối tượng ở bất kỳ góc độ nào, cung cấp khả năng phát hiện chính xác hơn so với các hộp bao truyền thống.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionHộp bao định hướng (OBB) là gì và chúng khác biệt như thế nào so với hộp bao thông thường?#
Hộp bao định hướng (OBB) bao gồm một góc bổ sung để nâng cao độ chính xác khi định vị đối tượng trong ảnh. Không giống như các hộp bao thông thường vốn là các hình chữ nhật thẳng hàng với trục, OBB có thể xoay để khớp với hướng của đối tượng tốt hơn. Điều này đặc biệt hữu ích cho các ứng dụng đòi hỏi sự chính xác cao về vị trí đối tượng, chẳng hạn như ảnh chụp từ trên không hoặc ảnh vệ tinh (Hướng dẫn về Tập dữ liệu).
Link to this sectionLàm thế nào để huấn luyện model YOLO26n-obb bằng tập dữ liệu tùy chỉnh?#
Để huấn luyện model YOLO26n-obb với tập dữ liệu tùy chỉnh, hãy làm theo ví dụ bên dưới sử dụng Python hoặc CLI:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n-obb.pt")
# Train the model
results = model.train(data="path/to/custom_dataset.yaml", epochs=100, imgsz=640)Để biết thêm các tham số huấn luyện, hãy xem phần Cấu hình.
Link to this sectionTôi có thể sử dụng những tập dữ liệu nào để huấn luyện các model YOLO26-OBB?#
Các model YOLO26-OBB được huấn luyện trước trên các tập dữ liệu như DOTAv1, nhưng bạn có thể sử dụng bất kỳ tập dữ liệu nào được định dạng cho OBB. Thông tin chi tiết về các định dạng tập dữ liệu OBB có thể được tìm thấy trong Hướng dẫn về Tập dữ liệu.
Link to this sectionLàm thế nào tôi có thể xuất model YOLO26-OBB sang định dạng ONNX?#
Việc xuất model YOLO26-OBB sang định dạng ONNX rất đơn giản bằng cách sử dụng Python hoặc CLI:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt")
# Export the model
model.export(format="onnx")Để biết thêm các định dạng xuất và thông tin chi tiết, hãy tham khảo trang Xuất.
Link to this sectionLàm thế nào để xác thực độ chính xác của model YOLO26n-obb?#
Để xác thực model YOLO26n-obb, bạn có thể sử dụng các lệnh Python hoặc CLI như hiển thị dưới đây:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt")
# Validate the model
metrics = model.val(data="dota8.yaml")Xem chi tiết đầy đủ về xác thực trong phần Val.

