Tập dữ liệu DOTA8

Giới thiệu

Ultralytics DOTA8 là một bộ dữ liệu phát hiện đối tượng định hướng nhỏ nhưng linh hoạt bao gồm 8 hình ảnh đầu tiên của 8 hình ảnh của bộ DOTAv1 được chia, 4 để đào tạo và 4 để xác nhận. Tập dữ liệu này lý tưởng để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng hoặc để thử nghiệm các phương pháp phát hiện mới. Với 8 hình ảnh, nó đủ nhỏ để dễ dàng quản lý, nhưng đủ đa dạng để kiểm tra các đường ống đào tạo để tìm lỗi và hoạt động như một kiểm tra tỉnh táo trước khi đào tạo các bộ dữ liệu lớn hơn.

Tập dữ liệu này được thiết kế để sử dụng với Ultralytics HUB và YOLOv8.

Tập dữ liệu YAML

Tệp YAML (Yet Another Markup Language) được sử dụng để xác định cấu hình tập dữ liệu. Nó chứa thông tin về đường dẫn, lớp và thông tin liên quan khác của tập dữ liệu. Trong trường hợp tập dữ liệu DOTA8, dota8.yaml Tệp được duy trì tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml.

ultralytics/cfg/datasets/dota8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA8 dataset 8 images from split DOTAv1 dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8  ← downloads here (1MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

Sử dụng

Để đào tạo một YOLOv8nMô hình -obb trên tập dữ liệu DOTA8 cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Hình ảnh mẫu và chú thích

Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu DOTA8, cùng với các chú thích tương ứng của chúng:

Hình ảnh mẫu tập dữ liệu

Hình ảnh khảm: Hình ảnh này thể hiện một lô đào tạo bao gồm các hình ảnh tập dữ liệu được khảm. Khảm là một kỹ thuật được sử dụng trong quá trình đào tạo kết hợp nhiều hình ảnh thành một hình ảnh duy nhất để tăng sự đa dạng của các đối tượng và cảnh trong mỗi đợt đào tạo. Điều này giúp cải thiện khả năng khái quát hóa mô hình cho các kích thước đối tượng, tỷ lệ khung hình và ngữ cảnh khác nhau.

Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong tập dữ liệu DOTA8 và lợi ích của việc sử dụng khảm trong quá trình đào tạo.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu DOTA trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

BibTeX

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

Một lưu ý đặc biệt về lòng biết ơn đối với nhóm đằng sau các bộ dữ liệu DOTA vì nỗ lực đáng khen ngợi của họ trong việc quản lý bộ dữ liệu này. Để hiểu toàn diện về tập dữ liệu và các sắc thái của nó, vui lòng truy cập trang web chính thức của DOTA.

FAQ

Tập dữ liệu DOTA8 là gì và nó có thể được sử dụng như thế nào?

Bộ dữ liệu DOTA8 là một bộ dữ liệu phát hiện đối tượng nhỏ, linh hoạt được tạo thành từ 8 hình ảnh đầu tiên từ bộ phân tách DOTAv1, với 4 hình ảnh được chỉ định để đào tạo và 4 hình ảnh để xác nhận. Đó là lý tưởng để kiểm tra và gỡ lỗi các mô hình phát hiện đối tượng như Ultralytics YOLOv8. Do kích thước và sự đa dạng có thể quản lý được, nó giúp xác định lỗi đường ống và chạy kiểm tra sự tỉnh táo trước khi triển khai các bộ dữ liệu lớn hơn. Tìm hiểu thêm về tính năng phát hiện đối tượng với Ultralytics YOLOv8.

Làm cách nào để đào tạo một YOLOv8 mô hình sử dụng tập dữ liệu DOTA8?

Để đào tạo một YOLOv8nMô hình -obb trên tập dữ liệu DOTA8 cho 100 kỷ nguyên với kích thước hình ảnh là 640, bạn có thể sử dụng các đoạn mã sau. Để biết các tùy chọn đối số toàn diện, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo obb train data=dota8.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

Các tính năng chính của tập dữ liệu DOTA là gì và tôi có thể truy cập tệp YAML ở đâu?

Bộ dữ liệu DOTA được biết đến với điểm chuẩn quy mô lớn và những thách thức mà nó đưa ra để phát hiện đối tượng trong hình ảnh trên không. Tập hợp con DOTA8 là một tập dữ liệu nhỏ hơn, có thể quản lý lý tưởng cho các thử nghiệm ban đầu. Bạn có thể truy cập dota8.yaml tệp, chứa đường dẫn, lớp và chi tiết cấu hình, tại đây Liên kết GitHub.

Làm thế nào để khảm tăng cường đào tạo mô hình với tập dữ liệu DOTA8?

Khảm kết hợp nhiều hình ảnh thành một trong quá trình đào tạo, tăng sự đa dạng của các đối tượng và bối cảnh trong mỗi đợt. Điều này cải thiện khả năng khái quát hóa của mô hình theo các kích thước đối tượng, tỷ lệ khung hình và cảnh khác nhau. Kỹ thuật này có thể được thể hiện trực quan thông qua một đợt đào tạo bao gồm các hình ảnh tập dữ liệu DOTA8 được khảm, giúp phát triển mô hình mạnh mẽ. Khám phá thêm về khảm và kỹ thuật đào tạo trên trang Đào tạo của chúng tôi.

Tại sao tôi nên sử dụng Ultralytics YOLOv8 cho các nhiệm vụ phát hiện đối tượng?

Ultralytics YOLOv8 cung cấp khả năng phát hiện đối tượng theo thời gian thực hiện đại, bao gồm các tính năng như hộp giới hạn định hướng (OBB), phân đoạn phiên bản và quy trình đào tạo rất linh hoạt. Nó phù hợp cho các ứng dụng khác nhau và cung cấp các mô hình được đào tạo trước để tinh chỉnh hiệu quả. Khám phá thêm về những lợi thế và cách sử dụng trong Ultralytics YOLOv8 tài liệu.

Đã tạo 2024-01-09, Cập nhật 2024-07-04
Tác giả: glenn-jocher (3), Laughing-q (1)