DOTA128 데이터셋

소개

Ultralytics DOTA128은 작지만 다재다능한 oriented 객체 탐지 데이터셋으로, DOTAv1 세트에서 추출한 128개의 이미지로 구성되어 있으며 학습 및 검증에 각각 128개가 사용됩니다. 이 데이터셋은 OBB(oriented bounding box) 모델을 테스트 및 디버깅하거나 새로운 탐지 접근 방식을 실험하는 데 이상적입니다. 128개의 이미지로 구성되어 관리가 간편하면서도, 더 큰 데이터셋을 학습하기 전에 학습 파이프라인의 오류를 테스트하고 정상 작동 여부를 확인하는 용도로 충분히 다양합니다.

데이터셋 구조

  • 이미지: DOTAv1에서 추출한 128개의 항공 타일(모두 train 폴더에 있으며, 학습 및 검증 용도로 사용됨).
  • 클래스(Classes): 비행기, 선박, 대형 차량 등 15개의 DOTAv1 카테고리를 상속합니다.
  • 라벨(Labels): YOLO 형식의 oriented bounding box가 각 이미지 옆의 .txt 파일로 저장됩니다.

이 데이터셋은 다음 용도로 사용하도록 설계되었습니다: Ultralytics PlatformYOLO26.

데이터셋 YAML

데이터셋 구성을 정의하기 위해 YAML(Yet Another Markup Language) 파일이 사용됩니다. 이 파일에는 데이터셋 경로, 클래스 및 기타 관련 정보가 포함되어 있습니다. DOTA128 데이터셋의 경우, dota128.yaml 파일은 다음 위치에서 관리됩니다: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

사용법

DOTA128 데이터셋에서 YOLO26n-obb 모델을 100 epochs 동안 640 이미지 크기로 학습하려면 다음 코드 스니펫을 사용할 수 있습니다. 사용 가능한 인수의 전체 목록은 모델 학습(Training) 페이지를 확인하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

샘플 이미지 및 주석

다음은 DOTA128 데이터셋의 이미지 예시와 그에 해당하는 어노테이션입니다:

DOTA128 oriented bounding box dataset training mosaic
  • 모자이크된 이미지(Mosaiced Image): 이 이미지는 모자이크 처리된 데이터셋 이미지로 구성된 학습 배치를 보여줍니다. 모자이킹은 학습 중에 여러 이미지를 하나의 이미지로 결합하여 각 학습 배치 내의 객체와 장면의 다양성을 높이는 기법입니다. 이는 다양한 객체 크기, 가로세로 비율 및 컨텍스트에 일반화하는 모델의 능력을 향상시키는 데 도움이 됩니다.

이 예시는 DOTA128 데이터셋에 포함된 이미지들의 다양성과 복잡성을 보여주며, 학습 과정에서 모자이킹(mosaicing)을 사용할 때의 이점을 강조합니다.

인용 및 감사의 글

연구나 개발 작업에 DOTA 데이터셋을 사용하는 경우 다음 논문을 인용해 주십시오:

인용
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

이 데이터셋을 큐레이션한 DOTA 데이터셋 팀의 노고에 특별한 감사를 표합니다. 데이터셋과 그 뉘앙스에 대한 자세한 내용을 보려면 공식 DOTA 웹사이트.

FAQ

DOTA128 데이터셋이란 무엇이며 어떻게 사용할 수 있나요?

DOTA128 데이터셋은 DOTAv1 세트에서 추출한 128개의 이미지로 구성된 다재다능한 oriented 객체 탐지 데이터셋으로, 모든 이미지가 train 폴더에 저장되어 있습니다. 학습과 검증 모두 동일한 이미지 세트를 사용하므로 빠른 테스트 및 디버깅 워크플로우에 이상적입니다. 특히 Ultralytics YOLO26과 같은 OBB 모델을 테스트하고 디버깅하는 데 최적화되어 있습니다. 관리하기 쉬운 크기와 데이터의 다양성 덕분에 더 큰 데이터셋을 배포하기 전에 파이프라인 오류를 식별하고 정상 작동 여부를 확인하는 데 도움이 됩니다. OBB 탐지에 대해 자세히 알아보려면 Ultralytics YOLO26.

DOTA128 데이터셋을 사용하여 YOLO26 모델을 어떻게 학습시키나요?

이미지 크기 640으로 100 에포크(epoch) 동안 DOTA128 데이터셋에서 YOLO26n-obb 모델을 학습시키려면 다음 코드 스니펫을 사용할 수 있습니다. 종합적인 인수 옵션은 모델 학습(Training) 페이지를 확인하십시오.

학습 예제
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

DOTA 데이터셋의 주요 특징은 무엇이며 YAML 파일은 어디서 액세스할 수 있나요?

DOTA 데이터셋은 대규모 벤치마크와 항공 이미지 객체 탐지 분야에서 제시하는 까다로운 과제들로 잘 알려져 있습니다. DOTA128 서브셋은 DOTA8보다 더 많은 다양성을 제공하면서도 초기 테스트에 용이한 규모를 유지합니다. 다음에서 액세스할 수 있습니다. dota128.yaml 파일은 이 GitHub 링크.

DOTA128은 다른 DOTA 데이터셋 변형들과 어떻게 비교되나요?

DOTA128(128개 이미지)은 DOTA8 (8개 이미지)와 전체 DOTA-v1 데이터셋(1,869개 이미지)의 크기 중간 정도에 위치합니다:

  • DOTA8: 8개의 이미지만 포함(학습 4개, 검증 4개) - 빠른 테스트 및 디버깅에 이상적
  • DOTA128: 128개의 이미지 포함(모두 train 폴더에 있으며 학습 및 검증 용도로 사용됨) - 크기와 다양성 간의 균형
  • Full DOTA-v1: 1,869개의 이미지 포함 - 포괄적이지만 리소스 소모가 큼

DOTA128은 실험 및 초기 모델 개발을 위해 DOTA8보다는 더 많은 다양성을 제공하면서도 전체 DOTA 데이터셋보다 훨씬 관리하기 쉬운 중간 지점을 제공합니다.

모자이킹(mosaicing)은 DOTA128 데이터셋을 사용한 모델 학습을 어떻게 향상시키나요?

모자이킹은 학습 중에 여러 이미지를 하나로 결합하여 각 배치 내 객체와 컨텍스트의 다양성을 높입니다. 이는 모델이 다양한 객체 크기, 가로세로 비율, 장면에 일반화하는 능력을 향상시킵니다. 이 기술은 DOTA128 데이터셋 이미지를 모자이크 처리하여 구성한 학습 배치를 통해 시각적으로 입증될 수 있으며, 견고한 모델을 개발하는 데 도움이 됩니다. 모자이킹 및 학습 기술에 대한 자세한 내용은 다음을 참조하십시오. 학습(Training) 페이지를 확인하십시오.

oriented 객체 탐지 작업을 위해 Ultralytics YOLO26을 사용해야 하는 이유는 무엇인가요?

Ultralytics YOLO26은 oriented bounding boxes(OBB), 인스턴스 세그멘테이션 및 매우 다재다능한 학습 파이프라인과 같은 기능을 포함하여 최첨단 실시간 객체 탐지 기능을 제공합니다. 다양한 애플리케이션에 적합하며 효율적인 파인튜닝을 위한 사전 학습된 모델을 제공합니다. 장점과 사용법에 대해 자세히 알아보려면 Ultralytics YOLO26 문서.

댓글