Chuyển đến nội dung

Bộ dữ liệu DOTA128

Giới thiệu

Ultralytics DOTA128 là một tập dữ liệu phát hiện đối tượng định hướng nhỏ nhưng đa năng, bao gồm 128 hình ảnh từ bộ DOTAv1, 128 hình ảnh dùng cho huấn luyện và 128 hình ảnh dùng cho xác thực. Tập dữ liệu này lý tưởng để kiểm tra và gỡ lỗi các mô hình hộp giới hạn định hướng (OBB), hoặc để thử nghiệm các phương pháp phát hiện mới. Với 128 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các quy trình huấn luyện xem có lỗi hay không và đóng vai trò như một bước kiểm tra ban đầu trước khi huấn luyện trên các tập dữ liệu lớn hơn.

Cấu trúc bộ dữ liệu

  • Hình ảnh : 128 ô ảnh chụp từ trên không (tất cả đều nằm trong thư mục train, được sử dụng cho cả train và val) được lấy từ DOTAv1.
  • Lớp: Kế thừa 15 danh mục DOTAv1 như máy bay, tàu và phương tiện lớn.
  • Nhãn: Các hộp giới hạn hướng đối tượng theo định dạng YOLO được lưu dưới dạng .txt tệp bên cạnh mỗi hình ảnh.

Bộ dữ liệu này được thiết kế để sử dụng với Nền tảng UltralyticsYOLO26.

YAML bộ dữ liệu

Tệp YAML (Yet Another Markup Language) được sử dụng để định nghĩa cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và các thông tin liên quan khác của tập dữ liệu. Trong trường hợp tập dữ liệu DOTA128, dota128.yaml tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics /cfg/datasets/dota128. yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Cách sử dụng

Để huấn luyện YOLO26n- obb Để huấn luyện mô hình trên tập dữ liệu DOTA128 trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các tham số có sẵn, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Ảnh và Chú thích mẫu

Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu DOTA128, cùng với các chú thích tương ứng:

Bộ dữ liệu hộp giới hạn định hướng DOTA128 dùng để huấn luyện (mô hình ghép)

  • Hình ảnh Mosaiced: Hình ảnh này minh họa một lô huấn luyện bao gồm các hình ảnh bộ dữ liệu được mosaiced. Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện, kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi lô huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và ngữ cảnh khác nhau của đối tượng.

Ví dụ này minh họa sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu DOTA128 cũng như lợi ích của việc sử dụng kỹ thuật ghép ảnh trong quá trình huấn luyện.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Một lời cảm ơn đặc biệt đến nhóm đằng sau bộ dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý bộ dữ liệu này. Để hiểu thấu đáo về bộ dữ liệu và các sắc thái của nó, vui lòng truy cập trang web DOTA chính thức.

Câu hỏi thường gặp

Bộ dữ liệu DOTA128 là gì và có thể sử dụng nó như thế nào?

Bộ dữ liệu DOTA128 là một bộ dữ liệu phát hiện đối tượng đa năng bao gồm 128 hình ảnh từ bộ DOTAv1, tất cả đều được lưu trữ trong thư mục train. Cả quá trình huấn luyện và xác thực đều sử dụng cùng một tập hợp hình ảnh, lý tưởng cho việc kiểm tra nhanh và gỡ lỗi. Nó rất phù hợp để kiểm tra và gỡ lỗi các mô hình OBB như... Ultralytics YOLO26. Nhờ kích thước nhỏ gọn và tính đa dạng, nó giúp xác định lỗi trong quy trình xử lý dữ liệu và thực hiện kiểm tra tính hợp lệ trước khi triển khai các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện OBB với Ultralytics YOLO26 .

Tôi có thể huấn luyện mô hình YOLO26 bằng cách sử dụng tập dữ liệu DOTA128 như thế nào?

Để huấn luyện YOLO26n- obb Với mô hình trên tập dữ liệu DOTA128 trong 100 epoch với kích thước ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn tham số đầy đủ, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640

Các tính năng chính của bộ dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?

Bộ dữ liệu DOTA nổi tiếng với quy mô lớn và những thách thức mà nó đặt ra cho việc phát hiện đối tượng trong ảnh chụp từ trên không. Tập con DOTA128 cung cấp sự đa dạng hơn so với DOTA8 trong khi vẫn dễ quản lý cho các thử nghiệm ban đầu. Bạn có thể truy cập... dota128.yaml tập tin, chứa đường dẫn, các lớp và chi tiết cấu hình, tại Liên kết GitHub.

DOTA128 có những điểm gì khác biệt so với các biến thể bộ dữ liệu DOTA khác?

DOTA128 (128 hình ảnh) nằm giữa DOTA8 (8 hình ảnh) và bộ dữ liệu DOTA-v1 đầy đủ (1.869 hình ảnh) về kích thước:

  • DOTA8 : Chỉ chứa 8 hình ảnh (4 huấn luyện, 4 kiểm thử) - lý tưởng cho việc kiểm tra nhanh và gỡ lỗi.
  • DOTA128 : Chứa 128 hình ảnh (tất cả đều nằm trong thư mục train, được sử dụng cho cả quá trình huấn luyện và kiểm thử) - cân bằng giữa kích thước và sự đa dạng.
  • Bản đầy đủ DOTA-v1 : Chứa 1.869 hình ảnh - toàn diện nhưng tốn nhiều tài nguyên.

DOTA128 cung cấp một sự cân bằng tốt, mang lại sự đa dạng hơn DOTA8 trong khi vẫn dễ quản lý hơn nhiều so với bộ dữ liệu DOTA đầy đủ để thử nghiệm và phát triển mô hình ban đầu.

Việc ghép ảnh giúp cải thiện quá trình huấn luyện mô hình với tập dữ liệu DOTA128 như thế nào?

Kỹ thuật ghép ảnh (mosaicing) kết hợp nhiều hình ảnh thành một trong quá trình huấn luyện, làm tăng sự đa dạng về đối tượng và ngữ cảnh trong mỗi lô ảnh. Điều này cải thiện khả năng khái quát hóa của mô hình đối với các kích thước đối tượng, tỷ lệ khung hình và cảnh khác nhau. Kỹ thuật này có thể được minh họa trực quan thông qua một lô huấn luyện bao gồm các hình ảnh được ghép từ bộ dữ liệu DOTA128, giúp phát triển mô hình mạnh mẽ hơn. Tìm hiểu thêm về kỹ thuật ghép ảnh và huấn luyện trên trang Huấn luyện của chúng tôi.

Tại sao tôi nên sử dụng Ultralytics YOLO26 có phù hợp cho các tác vụ phát hiện đối tượng có hướng không?

Ultralytics YOLO26 cung cấp khả năng detect đối tượng thời gian thực tiên tiến nhất, bao gồm các tính năng như hộp giới hạn định hướng (OBB), segment thực thể và một pipeline huấn luyện rất linh hoạt. Nó phù hợp cho nhiều ứng dụng khác nhau và cung cấp các mô hình tiền huấn luyện để tinh chỉnh hiệu quả. Khám phá thêm về các ưu điểm và cách sử dụng trong tài liệu Ultralytics YOLO26.



📅 Được tạo 0 ngày trước ✏️ Cập nhật 0 ngày trước
Laughing-q

Bình luận