DOTA8 데이터셋
소개
Ultralytics DOTA8은 분할된 DOTAv1 세트의 처음 8개 이미지(학습용 4개, 검증용 4개)로 구성된 작고 다재다능한 지향성 object detection 데이터셋입니다. 이 데이터셋은 object detection 모델을 테스트 및 디버깅하거나 새로운 탐지 방식을 실험하는 데 이상적입니다. 8개의 이미지로 구성되어 관리가 용이할 뿐만 아니라, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 상태 점검을 수행하기에 충분히 다양합니다.
데이터셋 구조
-
이미지: DOTAv1에서 추출한 8개의 항공 타일(학습용 4개, 검증용 4개).
-
클래스: 비행기, 선박, 대형 차량 등 15개의 DOTAv1 카테고리를 계승합니다.
-
라벨: 각 이미지 옆에
.txt파일로 저장된 YOLO 형식의 지향성 바운딩 박스. -
권장 레이아웃:
datasets/dota8/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/
이 데이터셋은 Ultralytics Platform 및 YOLO26과 함께 사용하도록 의도되었습니다.
데이터셋 YAML
데이터셋 구성을 정의하기 위해 YAML(Yet Another Markup Language) 파일이 사용됩니다. 여기에는 데이터셋의 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. DOTA8 데이터셋의 경우, dota8.yaml 파일이 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yaml에서 관리됩니다.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip사용법
DOTA8 데이터셋에서 이미지 크기 640으로 100 epochs 동안 YOLO26n-obb 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수에 대한 전체 목록은 모델 Training 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)샘플 이미지 및 주석
다음은 DOTA8 데이터셋 이미지와 그에 대응하는 어노테이션 예시입니다:
- 모자이크 이미지: 이 이미지는 모자이크 처리된 데이터셋 이미지들로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 데 사용되는 기법입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율 및 문맥으로 일반화하는 능력을 향상시키는 데 도움을 줍니다.
이 예시는 DOTA8 데이터셋 이미지의 다양성과 복잡성, 그리고 학습 과정에서 모자이킹(mosaicing)을 사용할 때의 이점을 보여줍니다.
인용 및 감사의 글
연구 또는 개발 작업에 DOTA 데이터셋을 사용하는 경우, 다음 논문을 인용해 주십시오:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}이 데이터셋을 큐레이팅하기 위해 기울인 노고에 대해 DOTA 데이터셋 팀에 특별한 감사를 표합니다. 데이터셋과 그 세부 사항을 완전히 이해하려면 공식 DOTA 웹사이트를 방문하십시오.
FAQ
DOTA8 데이터셋이란 무엇이며 어떻게 사용할 수 있습니까?
DOTA8 데이터셋은 DOTAv1 분할 세트의 처음 8개 이미지로 구성된 작고 다재다능한 지향성 object detection 데이터셋으로, 4개 이미지는 학습용으로, 4개는 검증용으로 지정되어 있습니다. 이는 Ultralytics YOLO26과 같은 object detection 모델을 테스트하고 디버깅하는 데 이상적입니다. 다루기 쉬운 크기와 다양성 덕분에 파이프라인 오류를 식별하고 더 큰 데이터셋을 배포하기 전에 상태 점검을 수행하는 데 도움이 됩니다. Ultralytics YOLO26을 통해 object detection에 대해 더 알아보십시오.
DOTA8 데이터셋을 사용하여 어떻게 YOLO26 모델을 학습합니까?
DOTA8 데이터셋에서 이미지 크기 640으로 100 epochs 동안 YOLO26n-obb 모델을 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 포괄적인 인수 옵션은 모델 Training 페이지를 참조하십시오.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)DOTA 데이터셋의 주요 특징은 무엇이며 YAML 파일은 어디에서 액세스할 수 있습니까?
DOTA 데이터셋은 대규모 벤치마크와 항공 이미지의 object detection에서 제시하는 과제로 잘 알려져 있습니다. DOTA8 하위 집합은 초기 테스트에 이상적인 작고 관리하기 쉬운 데이터셋입니다. 경로, 클래스 및 구성 세부 정보가 포함된 dota8.yaml 파일은 이 GitHub 링크에서 액세스할 수 있습니다.
모자이킹은 DOTA8 데이터셋을 사용한 모델 학습을 어떻게 향상시킵니까?
모자이킹은 학습 중에 여러 이미지를 하나로 결합하여 각 배치 내 객체와 맥락의 다양성을 증가시킵니다. 이는 다양한 객체 크기, 가로세로 비율 및 장면에 대해 모델이 일반화할 수 있는 능력을 향상시킵니다. 이 기술은 모자이킹된 DOTA8 데이터셋 이미지로 구성된 학습 배치를 통해 시각적으로 입증될 수 있으며, 견고한 모델 개발에 도움이 됩니다. 모자이킹과 학습 기술에 대한 자세한 내용은 Training 페이지에서 확인하십시오.
object detection 작업에 왜 Ultralytics YOLO26을 사용해야 합니까?
Ultralytics YOLO26은 OBB(지향성 바운딩 박스), instance segmentation 및 매우 다재다능한 학습 파이프라인을 포함한 최첨단 실시간 object detection 기능을 제공합니다. 다양한 애플리케이션에 적합하며 효율적인 파인튜닝을 위한 사전 학습된 모델을 제공합니다. Ultralytics YOLO26 문서에서 이점과 사용법에 대해 더 자세히 알아보십시오.