Meet YOLO26: next-gen vision AI.

Link to this sectionTập dữ liệu DOTA8#

Link to this sectionGiới thiệu#

Ultralytics DOTA8 là một tập dữ liệu phát hiện đối tượng theo hướng nhỏ gọn nhưng linh hoạt, bao gồm 8 hình ảnh đầu tiên của bộ DOTAv1 được chia tách, với 4 ảnh dùng để huấn luyện và 4 ảnh để kiểm thử. Tập dữ liệu này rất lý tưởng để kiểm tra và gỡ lỗi các model phát hiện đối tượng, hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ dàng quản lý, nhưng vẫn đủ đa dạng để kiểm tra các pipeline huấn luyện xem có lỗi không và đóng vai trò như một bài kiểm tra nhanh trước khi huấn luyện trên các tập dữ liệu lớn hơn.

Link to this sectionCấu trúc tập dữ liệu#

  • Hình ảnh: 8 ảnh chụp từ trên không (4 ảnh train, 4 ảnh val) được lấy từ DOTAv1.

  • Các lớp (Classes): Thừa hưởng 15 danh mục của DOTAv1 như máy bay, tàu thủy, và xe cơ giới cỡ lớn.

  • Nhãn (Labels): Các hộp bao quanh theo hướng (oriented bounding boxes) định dạng YOLO được lưu dưới dạng tệp .txt nằm cạnh mỗi hình ảnh.

  • Bố cục đề xuất:

    datasets/dota8/
    ├── images/
    │   ├── train/
    │   └── val/
    └── labels/
        ├── train/
        └── val/

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics PlatformYOLO26.

Link to this sectionYAML tập dữ liệu#

Một tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, các lớp và thông tin liên quan khác của tập dữ liệu. Đối với tập dữ liệu DOTA8, tệp dota8.yaml được lưu tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Link to this sectionCách sử dụng#

Để huấn luyện model YOLO26n-obb trên tập dữ liệu DOTA8 trong 100 epoch với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn code sau. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện model.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

Link to this sectionHình ảnh mẫu và chú thích#

Dưới đây là một số ví dụ về các hình ảnh từ tập dữ liệu DOTA8, cùng với các chú thích (annotation) tương ứng:

DOTA8 oriented bounding box dataset training mosaic
  • Hình ảnh Mosaiced: Hình ảnh này minh họa một batch huấn luyện bao gồm các hình ảnh từ tập dữ liệu đã được áp dụng kỹ thuật Mosaic. Mosaic là một kỹ thuật được sử dụng trong quá trình huấn luyện nhằm kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch huấn luyện. Điều này giúp cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu DOTA8 cũng như những lợi ích của việc sử dụng kỹ thuật mosaicing trong quá trình huấn luyện.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Đặc biệt cảm ơn đội ngũ đứng sau các tập dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý tập dữ liệu này. Để hiểu tường tận về tập dữ liệu và các đặc thù của nó, vui lòng truy cập trang web chính thức của DOTA.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu DOTA8 là gì và làm thế nào để sử dụng nó?#

Tập dữ liệu DOTA8 là một tập dữ liệu phát hiện đối tượng theo hướng nhỏ gọn, linh hoạt, bao gồm 8 hình ảnh đầu tiên từ bộ DOTAv1 đã được chia tách, với 4 hình ảnh dành cho huấn luyện và 4 hình ảnh cho kiểm thử. Nó rất lý tưởng để kiểm tra và gỡ lỗi các model phát hiện đối tượng như Ultralytics YOLO26. Nhờ kích thước dễ quản lý và tính đa dạng, nó giúp xác định lỗi trong pipeline và chạy kiểm tra nhanh trước khi triển khai trên các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện đối tượng với Ultralytics YOLO26.

Link to this sectionLàm cách nào để huấn luyện model YOLO26 sử dụng tập dữ liệu DOTA8?#

Để huấn luyện model YOLO26n-obb trên tập dữ liệu DOTA8 trong 100 epoch với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn code sau. Để biết các tùy chọn đối số đầy đủ, hãy tham khảo trang Huấn luyện model.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

Link to this sectionCác tính năng chính của tập dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?#

Tập dữ liệu DOTA được biết đến với quy mô chuẩn lớn và các thách thức mà nó đặt ra cho việc phát hiện đối tượng trong hình ảnh chụp từ trên không. Tập con DOTA8 là một tập dữ liệu nhỏ hơn, dễ quản lý, lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập tệp dota8.yaml, trong đó chứa các đường dẫn, lớp và chi tiết cấu hình, tại liên kết GitHub này.

Link to this sectionMosaicing nâng cao hiệu quả huấn luyện model với tập dữ liệu DOTA8 như thế nào?#

Mosaicing kết hợp nhiều hình ảnh thành một trong quá trình huấn luyện, làm tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi batch. Điều này cải thiện khả năng tổng quát hóa của model đối với các kích thước đối tượng, tỷ lệ khung hình và khung cảnh khác nhau. Kỹ thuật này có thể được minh họa trực quan thông qua một batch huấn luyện bao gồm các hình ảnh DOTA8 đã được ghép mosaicing, giúp phát triển model mạnh mẽ hơn. Khám phá thêm về mosaicing và các kỹ thuật huấn luyện trên trang Huấn luyện của chúng tôi.

Link to this sectionTại sao tôi nên sử dụng Ultralytics YOLO26 cho các tác vụ phát hiện đối tượng?#

Ultralytics YOLO26 cung cấp các khả năng phát hiện đối tượng theo thời gian thực hiện đại, bao gồm các tính năng như hộp bao quanh theo hướng (OBB), phân đoạn đối tượng (instance segmentation) và một pipeline huấn luyện linh hoạt cao. Nó phù hợp cho nhiều ứng dụng khác nhau và cung cấp các model đã được huấn luyện sẵn để tinh chỉnh hiệu quả. Khám phá thêm về các ưu điểm và cách sử dụng trong tài liệu Ultralytics YOLO26.

Bình luận