Bỏ qua nội dung

Tổng quan về bộ dữ liệu Oriented Bounding Box (OBB)

Việc đào tạo một mô hình phát hiện đối tượng chính xác với các hộp giới hạn định hướng (OBB) đòi hỏi một tập dữ liệu đầy đủ. Hướng dẫn này giải thích các định dạng tập dữ liệu OBB khác nhau tương thích với Ultralytics YOLO các mô hình, cung cấp thông tin chi tiết về cấu trúc, ứng dụng và phương pháp chuyển đổi định dạng của chúng.

Định dạng tập dữ liệu OBB được hỗ trợ

YOLO Định dạng OBB

Các YOLO Định dạng OBB chỉ định các hộp giới hạn theo bốn điểm góc của chúng với tọa độ được chuẩn hóa giữa 0 và 1. Định dạng này tuân theo định dạng sau:

class_index x1 y1 x2 y2 x3 y3 x4 y4

Bên trong, YOLO xử lý tổn thất và đầu ra trong xywhr định dạng, đại diện cho hộp giới hạnĐiểm trung tâm của 'xy', chiều rộng, chiều cao và góc quay.

Ví dụ về định dạng OBB

Một ví dụ về một *.txt tập tin nhãn cho hình ảnh trên, trong đó có chứa một đối tượng của lớp 0 ở định dạng OBB, có thể trông như thế này:

0 0.780811 0.743961 0.782371 0.74686 0.777691 0.752174 0.776131 0.749758

Cách sử dụng

Để đào tạo một mô hình sử dụng các định dạng OBB này:

Ví dụ

from ultralytics import YOLO

# Create a new YOLO11n-OBB model from scratch
model = YOLO("yolo11n-obb.yaml")

# Train the model on the DOTAv1 dataset
results = model.train(data="DOTAv1.yaml", epochs=100, imgsz=1024)
# Train a new YOLO11n-OBB model on the DOTAv1 dataset
yolo obb train data=DOTAv1.yaml model=yolo11n-obb.pt epochs=100 imgsz=1024

Bộ dữ liệu được hỗ trợ

Hiện tại, các tập dữ liệu sau đây có Hộp giới hạn định hướng được hỗ trợ:

  • DOTA-v1 : Phiên bản đầu tiên của bộ dữ liệu DOTA, cung cấp một bộ ảnh trên không toàn diện với các hộp giới hạn định hướng để phát hiện vật thể.
  • DOTA-v1.5 : Phiên bản trung gian của bộ dữ liệu DOTA, cung cấp thêm chú thích và cải tiến so với DOTA-v1 để nâng cao nhiệm vụ phát hiện đối tượng.
  • DOTA-v2 : DOTA (Bộ dữ liệu quy mô lớn để phát hiện đối tượng trong ảnh trên không) phiên bản 2, nhấn mạnh vào khả năng phát hiện từ góc nhìn trên không và chứa các hộp giới hạn định hướng với 1,7 triệu trường hợp và 11.268 hình ảnh.
  • DOTA8: Một tập hợp con nhỏ gồm 8 hình ảnh của toàn bộ tập dữ liệu DOTA phù hợp để thử nghiệm quy trình làm việc và kiểm tra Tích hợp liên tục (CI) của đào tạo OBB trong ultralytics kho lưu trữ.

Kết hợp tập dữ liệu OBB của riêng bạn

Đối với những người muốn giới thiệu bộ dữ liệu của riêng họ với các hộp giới hạn định hướng, hãy đảm bảo khả năng tương thích với " YOLO Định dạng OBB" được đề cập ở trên. Chuyển đổi chú thích của bạn sang định dạng bắt buộc này và ghi chi tiết đường dẫn, lớp và tên lớp trong tệp cấu hình YAML tương ứng.

Chuyển đổi định dạng nhãn

Định dạng tập dữ liệu DOTA YOLO Định dạng OBB

Chuyển đổi nhãn từ định dạng tập dữ liệu DOTA sang YOLO Định dạng OBB có thể đạt được bằng tập lệnh này:

Ví dụ

from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

Cơ chế chuyển đổi này đóng vai trò quan trọng đối với các tập dữ liệu ở định dạng DOTA, đảm bảo sự phù hợp với Ultralytics YOLO Định dạng OBB.

Điều bắt buộc là phải xác thực tính tương thích của tập dữ liệu với mô hình của bạn và tuân thủ các quy ước định dạng cần thiết. Các tập dữ liệu có cấu trúc phù hợp đóng vai trò then chốt trong việc đào tạo các mô hình phát hiện đối tượng hiệu quả với các hộp giới hạn định hướng.

CÂU HỎI THƯỜNG GẶP

Hộp giới hạn định hướng (OBB) là gì và chúng được sử dụng như thế nào trong Ultralytics YOLO mô hình?

Hộp giới hạn định hướng (OBB) là một loại chú thích hộp giới hạn trong đó hộp có thể được xoay để căn chỉnh chặt chẽ hơn với đối tượng được phát hiện, thay vì chỉ căn chỉnh theo trục. Điều này đặc biệt hữu ích trong hình ảnh trên không hoặc vệ tinh, trong đó các đối tượng có thể không được căn chỉnh theo trục hình ảnh. Trong Ultralytics YOLO mô hình, OBB được biểu diễn bằng bốn điểm góc của chúng trong YOLO Định dạng OBB. Điều này cho phép phát hiện đối tượng chính xác hơn vì các hộp giới hạn có thể xoay để phù hợp với đối tượng hơn.

Làm thế nào để tôi chuyển đổi nhãn tập dữ liệu DOTA hiện tại của tôi thành YOLO Định dạng OBB để sử dụng với Ultralytics YOLO11 ?

Bạn có thể chuyển đổi nhãn tập dữ liệu DOTA thành YOLO Định dạng OBB sử dụng convert_dota_to_yolo_obb chức năng từ Ultralytics . Sự chuyển đổi này đảm bảo khả năng tương thích với Ultralytics YOLO mô hình, cho phép bạn tận dụng khả năng OBB để phát hiện đối tượng nâng cao. Sau đây là một ví dụ nhanh:

from ultralytics.data.converter import convert_dota_to_yolo_obb

convert_dota_to_yolo_obb("path/to/DOTA")

Tập lệnh này sẽ định dạng lại chú thích DOTA của bạn thành YOLO - định dạng tương thích.

Làm thế nào để tôi đào tạo một YOLO11 mô hình có hộp giới hạn định hướng (OBB) trên tập dữ liệu của tôi?

Đào tạo một YOLO11 mô hình với OBB liên quan đến việc đảm bảo tập dữ liệu của bạn nằm trong YOLO Định dạng OBB và sau đó sử dụng Ultralytics API để đào tạo mô hình. Đây là một ví dụ trong cả hai Python Và CLI :

Ví dụ

from ultralytics import YOLO

# Create a new YOLO11n-OBB model from scratch
model = YOLO("yolo11n-obb.yaml")

# Train the model on the custom dataset
results = model.train(data="your_dataset.yaml", epochs=100, imgsz=640)
# Train a new YOLO11n-OBB model on the custom dataset
yolo obb train data=your_dataset.yaml model=yolo11n-obb.yaml epochs=100 imgsz=640

Điều này đảm bảo mô hình của bạn tận dụng các chú thích OBB chi tiết để cải thiện độ chính xác khi phát hiện.

Những tập dữ liệu nào hiện đang được hỗ trợ cho đào tạo OBB trong Ultralytics YOLO mô hình?

Hiện nay, Ultralytics hỗ trợ các tập dữ liệu sau cho đào tạo OBB:

  • DOTA-v1 : Phiên bản đầu tiên của bộ dữ liệu DOTA, cung cấp một bộ ảnh trên không toàn diện với các hộp giới hạn định hướng để phát hiện vật thể.
  • DOTA-v1.5 : Phiên bản trung gian của bộ dữ liệu DOTA, cung cấp thêm chú thích và cải tiến so với DOTA-v1 để nâng cao nhiệm vụ phát hiện đối tượng.
  • DOTA-v2 : Bộ dữ liệu này bao gồm 1,7 triệu trường hợp có hộp giới hạn định hướng và 11.268 hình ảnh, chủ yếu tập trung vào phát hiện vật thể trên không.
  • DOTA8 : Một tập hợp con nhỏ hơn gồm 8 hình ảnh của bộ dữ liệu DOTA được sử dụng để thử nghiệm và kiểm tra tích hợp liên tục (CI).

Các tập dữ liệu này được thiết kế riêng cho các tình huống mà OBB mang lại lợi thế đáng kể, chẳng hạn như phân tích hình ảnh trên không và vệ tinh.

Tôi có thể sử dụng tập dữ liệu của riêng tôi với các hộp giới hạn định hướng cho YOLO11 đào tạo, và nếu có thì như thế nào?

Có, bạn có thể sử dụng tập dữ liệu của riêng bạn với các hộp giới hạn định hướng cho YOLO11 đào tạo. Đảm bảo chú thích tập dữ liệu của bạn được chuyển đổi thành YOLO Định dạng OBB, bao gồm việc xác định các hộp giới hạn theo bốn điểm góc của chúng. Sau đó, bạn có thể tạo tệp cấu hình YAML chỉ định đường dẫn tập dữ liệu, lớp và các chi tiết cần thiết khác. Để biết thêm thông tin về việc tạo và cấu hình tập dữ liệu của bạn, hãy tham khảo phần Bộ dữ liệu được hỗ trợ .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận