Meet YOLO26: next-gen vision AI.

Link to this sectionTập dữ liệu DOTA128#

Link to this sectionGiới thiệu#

Ultralytics DOTA128 là một tập dữ liệu phát hiện đối tượng có hướng nhỏ gọn nhưng linh hoạt, bao gồm 128 hình ảnh từ tập DOTAv1, với 128 hình ảnh cho cả huấn luyện và kiểm thử. Tập dữ liệu này rất lý tưởng để kiểm tra và gỡ lỗi các model hộp bao có hướng (OBB), hoặc để thử nghiệm các phương pháp phát hiện mới. Với 128 hình ảnh, tập dữ liệu này đủ nhỏ để dễ dàng quản lý, nhưng vẫn đủ đa dạng để kiểm tra các pipeline huấn luyện tìm lỗi và đóng vai trò như một bước kiểm tra sơ bộ trước khi huấn luyện trên các tập dữ liệu lớn hơn.

Link to this sectionCấu trúc tập dữ liệu#

  • Hình ảnh: 128 tile ảnh chụp từ trên không (tất cả nằm trong thư mục train, được dùng cho cả train và val) lấy từ DOTAv1.
  • Các lớp: Kế thừa 15 danh mục của DOTAv1 như máy bay, tàu thủy và phương tiện lớn.
  • Nhãn: Các hộp bao có hướng định dạng YOLO được lưu dưới dạng tệp .txt bên cạnh mỗi hình ảnh.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Link to this sectionDataset YAML#

Một tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và các thông tin liên quan khác của tập dữ liệu. Đối với tập dữ liệu DOTA128, tệp dota128.yaml được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Link to this sectionCách sử dụng#

Để huấn luyện model YOLO26n-obb trên tập dữ liệu DOTA128 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn code sau. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh và chú thích mẫu#

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu DOTA128, cùng với các chú thích tương ứng của chúng:

DOTA128 oriented bounding box dataset training mosaic
  • Mosaiced Image: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép lại (mosaic). Mosaicing là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các vật thể và cảnh quan trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của mô hình đối với các kích thước, tỷ lệ khung hình và bối cảnh vật thể khác nhau.

Ví dụ này thể hiện sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu DOTA128 cũng như những lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu DOTA trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Xin gửi lời tri ân đặc biệt đến đội ngũ đứng sau các tập dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý tập dữ liệu này. Để hiểu tường tận về tập dữ liệu và các sắc thái của nó, vui lòng truy cập trang web chính thức của DOTA.

Link to this sectionCâu hỏi thường gặp (FAQ)#

Link to this sectionTập dữ liệu DOTA128 là gì và nó có thể được sử dụng như thế nào?#

DOTA128 là tập dữ liệu phát hiện đối tượng có hướng linh hoạt gồm 128 hình ảnh từ tập DOTAv1, tất cả được lưu trữ trong thư mục train. Cả quá trình huấn luyện và kiểm thử đều sử dụng cùng một tập hình ảnh, giúp nó trở nên lý tưởng cho các quy trình kiểm tra và gỡ lỗi nhanh chóng. Nó rất phù hợp để kiểm thử và gỡ lỗi các model OBB như Ultralytics YOLO26. Nhờ kích thước dễ quản lý và tính đa dạng, nó giúp xác định lỗi pipeline và thực hiện các bước kiểm tra sơ bộ trước khi triển khai trên các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện OBB với Ultralytics YOLO26.

Link to this sectionLàm cách nào để tôi huấn luyện model YOLO26 sử dụng tập dữ liệu DOTA128?#

Để huấn luyện model YOLO26n-obb trên tập dữ liệu DOTA128 trong 100 epochs với kích thước ảnh là 640, bạn có thể sử dụng các đoạn code sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo trang Huấn luyện của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Link to this sectionCác tính năng chính của tập dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?#

Tập dữ liệu DOTA nổi tiếng với quy mô benchmark lớn và những thách thức mà nó mang lại cho việc phát hiện đối tượng trong ảnh chụp từ trên không. Tập con DOTA128 cung cấp sự đa dạng hơn so với DOTA8 trong khi vẫn đủ dễ quản lý cho các thử nghiệm ban đầu. Bạn có thể truy cập tệp dota128.yaml, vốn chứa các đường dẫn, lớp và thông tin cấu hình chi tiết, tại liên kết GitHub này.

Link to this sectionDOTA128 so sánh như thế nào với các biến thể khác của tập dữ liệu DOTA?#

DOTA128 (128 hình ảnh) nằm giữa DOTA8 (8 hình ảnh) và tập dữ liệu DOTA-v1 đầy đủ (1.869 hình ảnh) về mặt kích thước:

  • DOTA8: Chứa chỉ 8 hình ảnh (4 train, 4 val) - lý tưởng cho các thử nghiệm nhanh và gỡ lỗi.
  • DOTA128: Chứa 128 hình ảnh (tất cả nằm trong thư mục train, được dùng cho cả train và val) - cân bằng giữa kích thước và độ đa dạng.
  • Full DOTA-v1: Chứa 1.869 hình ảnh - toàn diện nhưng tốn kém tài nguyên.

DOTA128 cung cấp một điểm trung gian tốt, mang lại sự đa dạng hơn DOTA8 trong khi vẫn dễ quản lý hơn nhiều so với tập dữ liệu DOTA đầy đủ cho mục đích thử nghiệm và phát triển model ban đầu.

Link to this sectionMosaicing cải thiện quá trình huấn luyện model với tập dữ liệu DOTA128 như thế nào?#

Mosaicing kết hợp nhiều hình ảnh thành một trong quá trình huấn luyện, làm tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch. Điều này cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và các cảnh quay khác nhau. Kỹ thuật này có thể được minh họa trực quan thông qua một batch huấn luyện bao gồm các hình ảnh từ tập DOTA128 đã được xử lý bằng mosaicing, giúp phát triển các model mạnh mẽ. Khám phá thêm về mosaicing và các kỹ thuật huấn luyện trên trang Huấn luyện của chúng tôi.

Link to this sectionTại sao tôi nên sử dụng Ultralytics YOLO26 cho các tác vụ phát hiện đối tượng có hướng?#

Ultralytics YOLO26 cung cấp khả năng phát hiện đối tượng thời gian thực hiện đại, bao gồm các tính năng như hộp bao có hướng (OBB), phân đoạn đối tượng và pipeline huấn luyện vô cùng linh hoạt. Nó phù hợp cho nhiều ứng dụng khác nhau và cung cấp các model đã được huấn luyện sẵn để tinh chỉnh hiệu quả. Khám phá thêm về các ưu điểm và cách sử dụng trong tài liệu Ultralytics YOLO26.

Contributors

Bình luận