Bỏ qua nội dung

Bộ dữ liệu DOTA8

Giới thiệu

Ultralytics DOTA8 là một tập dữ liệu phát hiện đối tượng định hướng nhỏ nhưng linh hoạt bao gồm 8 hình ảnh đầu tiên trong số 8 hình ảnh của bộ DOTAv1 chia tách, 4 để đào tạo và 4 để xác thực. Tập dữ liệu này lý tưởng để thử nghiệm và gỡ lỗi các mô hình phát hiện đối tượng hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ quản lý, nhưng đủ đa dạng để kiểm tra các đường ống đào tạo để tìm lỗi và hoạt động như một kiểm tra hợp lý trước khi đào tạo các tập dữ liệu lớn hơn.

Bộ dữ liệu này được dự định sử dụng với Ultralytics HUBYOLO11 .

Bộ dữ liệu YAML

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Tệp này chứa thông tin về đường dẫn, lớp và các thông tin liên quan khác của tập dữ liệu. Trong trường hợp của tập dữ liệu DOTA8, dota8.yaml tập tin được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics /cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Cách sử dụng

Để đào tạo mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu DOTA8, cùng với chú thích tương ứng:

Hình ảnh mẫu của bộ dữ liệu

  • Mosaiced Image : Hình ảnh này minh họa một lô đào tạo bao gồm các hình ảnh tập dữ liệu mosaic. Mosaicing là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng tính đa dạng của các đối tượng và cảnh trong mỗi lô đào tạo. Điều này giúp cải thiện khả năng khái quát hóa của mô hình đối với các kích thước đối tượng, tỷ lệ khung hình và bối cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu DOTA8 và lợi ích của việc sử dụng khảm trong quá trình đào tạo.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu DOTA trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Xin gửi lời cảm ơn đặc biệt đến nhóm đằng sau bộ dữ liệu DOTA vì những nỗ lực đáng khen ngợi của họ trong việc biên soạn bộ dữ liệu này. Để hiểu rõ hơn về bộ dữ liệu và các sắc thái của nó, vui lòng truy cập trang web chính thức của DOTA .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu DOTA8 là gì và có thể sử dụng như thế nào?

Bộ dữ liệu DOTA8 là một bộ dữ liệu phát hiện đối tượng định hướng nhỏ, linh hoạt được tạo thành từ 8 hình ảnh đầu tiên từ bộ chia tách DOTAv1, với 4 hình ảnh được chỉ định để đào tạo và 4 hình ảnh để xác thực. Nó lý tưởng để thử nghiệm và gỡ lỗi các mô hình phát hiện đối tượng như Ultralytics YOLO11 . Do có kích thước và tính đa dạng có thể quản lý được, nó giúp xác định lỗi đường ống và chạy kiểm tra tính hợp lý trước khi triển khai các tập dữ liệu lớn hơn. Tìm hiểu thêm về phát hiện đối tượng với Ultralytics YOLO11 .

Làm thế nào để tôi đào tạo một YOLO11 mô hình sử dụng tập dữ liệu DOTA8?

Để đào tạo mô hình YOLO11n-obb trên tập dữ liệu DOTA8 trong 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolo11n-obb.pt epochs=100 imgsz=640

Các tính năng chính của bộ dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?

Bộ dữ liệu DOTA được biết đến với chuẩn mực quy mô lớn và những thách thức mà nó đặt ra cho việc phát hiện đối tượng trong hình ảnh trên không. Tập hợp con DOTA8 là một bộ dữ liệu nhỏ hơn, dễ quản lý, lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập dota8.yaml tập tin, chứa các đường dẫn, lớp và chi tiết cấu hình, tại đây Liên kết GitHub.

Khảm ảnh giúp cải thiện quá trình đào tạo mô hình bằng tập dữ liệu DOTA8 như thế nào?

Mosaicing kết hợp nhiều hình ảnh thành một trong quá trình đào tạo, tăng tính đa dạng của các đối tượng và bối cảnh trong mỗi đợt. Điều này cải thiện khả năng khái quát hóa của mô hình đối với các kích thước đối tượng, tỷ lệ khung hình và cảnh khác nhau. Kỹ thuật này có thể được chứng minh trực quan thông qua một đợt đào tạo bao gồm các hình ảnh tập dữ liệu DOTA8 được mosaic, giúp phát triển mô hình mạnh mẽ. Khám phá thêm về mosaicing và các kỹ thuật đào tạo trên trang Đào tạo của chúng tôi.

Tại sao tôi nên sử dụng Ultralytics YOLO11 cho nhiệm vụ phát hiện đối tượng?

Ultralytics YOLO11 cung cấp khả năng phát hiện đối tượng theo thời gian thực tiên tiến, bao gồm các tính năng như hộp giới hạn định hướng (OBB), phân đoạn thể hiện và đường ống đào tạo cực kỳ linh hoạt. Nó phù hợp với nhiều ứng dụng khác nhau và cung cấp các mô hình được đào tạo trước để tinh chỉnh hiệu quả. Khám phá thêm về các lợi thế và cách sử dụng trong tài liệu Ultralytics YOLO11 .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 3 tháng

Bình luận