DOTA128 データセット
はじめに
Ultralytics DOTA128は、DOTAv1セットから抽出した128枚の画像(トレーニング用128枚、検証用128枚)で構成される、小規模ながら汎用性の高い物体検出データセットです。このデータセットは、方向性バウンディングボックス(OBB)モデルのテストやデバッグ、あるいは新たな検出手法の実験に最適です。 128枚の画像という規模は扱いやすいほど小さく、かつ多様性に富んでいるため、トレーニングパイプラインのエラーテストや、大規模データセットのトレーニング前の健全性チェックとして活用できます。
データセットの構造
- 画像: 128枚の航空写真タイル(すべてtrainフォルダ内、列車とvalの両方に使用)はDOTAv1から取得。
- クラス: 飛行機、船、大型車両など、DOTAv1の15カテゴリを継承します。
- ラベル:YOLO形式の指向性バウンディングボックスは、として保存されます
.txt各画像の横にファイルとして。
このデータセットは、Ultralytics PlatformおよびYOLO26での使用を目的としています。
データセット YAML
YAML(Yet Another Markup Language)ファイルはデータセット構成を定義するために使用されます。データセットのパス、クラス、その他の関連情報を含みます。DOTA128データセットの場合、 dota128.yaml fileは以下で管理されています: https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
ultralytics.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip
使用法
obb 画像サイズ640で100エポック訓練するには、以下のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
サンプル画像とアノテーション
DOTA128データセットの画像例と、それに対応するアノテーションを以下に示します:

- モザイク化された画像: この画像は、モザイク化されたデータセット画像で構成されるトレーニングバッチを示しています。モザイキングは、各トレーニングバッチ内のオブジェクトとシーンの多様性を高めるために、複数の画像を1つの画像に結合するトレーニング中に使用される手法です。これにより、さまざまなオブジェクトのサイズ、アスペクト比、およびコンテキストに対するモデルの汎化能力が向上します。
この例は、DOTA128データセット内の画像の多様性と複雑さ、およびトレーニングプロセスにおけるモザイク処理の利点を示しています。
引用と謝辞
DOTAデータセットを研究または開発にご利用の際は、以下の論文を引用してください。
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
このデータセットのキュレーションにおける彼らの称賛に値する努力に対して、DOTAデータセットの背後にあるチームに特別な感謝の意を表します。データセットとそのニュアンスの包括的な理解については、DOTAの公式ウェブサイトをご覧ください。
よくある質問
DOTA128データセットとは何か、またどのように利用できるのか?
DOTA128データセットは、DOTAv1セットから抽出された128枚の画像で構成される汎用的な物体検出データセットです。全画像はtrainフォルダに保存されています。トレーニングと検証の両方で同一の画像セットを使用するため、迅速なテストやデバッグワークフローに最適です。Ultralytics などのOBBモデルテストやデバッグに最適です。扱いやすいサイズと多様性により、大規模データセット展開前のパイプラインエラー特定や健全性チェックの実行に役立ちます。Ultralytics によるOBB検出の詳細はこちら。
DOTA128データセットを使用してYOLO26モデルを訓練するにはどうすればよいですか?
DOTA128データセットでobb 画像サイズ640で100エポック訓練するには、以下のコードスニペットを使用できます。包括的な引数オプションについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo obb train data=dota128.yaml model=yolo26n-obb.pt epochs=100 imgsz=640
DOTAデータセットの主な特徴は何ですか?また、YAMLファイルはどこで入手できますか?
DOTAデータセットは、大規模なベンチマークと航空写真における物体検出の課題で知られています。DOTA128サブセットは、初期テストで扱いやすい規模を維持しつつ、DOTA8よりも多様性を提供します。アクセス方法は以下の通りです。 dota128.yaml このファイルには、パス、クラス、および構成の詳細が含まれています。 GitHubリンク.
DOTA128は他のDOTAデータセットのバリエーションと比べてどうですか?
DOTA128(128枚の画像)は、サイズにおいてDOTA8(8枚の画像)と完全なDOTA-v1データセット(1,869枚の画像)の中間に位置する:
- DOTA8: わずか8枚の画像(列車4枚、ヴァル4枚)のみを含む - 迅速なテストやデバッグに最適
- DOTA128: 128枚の画像を含む(全てtrainフォルダ内、訓練用と評価用双方に使用) - サイズと多様性のバランスが取れている
- フル DOTA-v1: 1,869枚の画像を含む - 包括的だがリソースを大量に消費する
DOTA128は適切な中間点を提供し、DOTA8よりも多様性を高めつつ、実験や初期モデル開発において完全なDOTAデータセットよりもはるかに扱いやすい特性を維持している。
モザイク処理はDOTA128データセットを用いたモデル学習をどのように強化するのか?
モザイク処理は、トレーニング中に複数の画像を1つに統合し、各バッチ内の物体と文脈の多様性を高めます。これにより、モデルが異なる物体のサイズ、アスペクト比、シーンに対して一般化する能力が向上します。この手法は、モザイク処理されたDOTA128データセット画像で構成されるトレーニングバッチを通じて視覚的に実証でき、堅牢なモデル開発に貢献します。モザイク処理とトレーニング手法の詳細については、当社のトレーニングページをご覧ください。
なぜ方向性のある物体検出タスクUltralytics を使用すべきなのでしょうか?
Ultralytics YOLO26は、oriented bounding boxes (obb)、インスタンスsegmentation、および非常に汎用性の高いトレーニングパイプラインなどの機能を含む、最先端のリアルタイム物体detect機能を提供します。様々なアプリケーションに適しており、効率的なファインチューニングのための事前学習済みモデルを提供します。Ultralytics YOLO26ドキュメントで、その利点と使用法についてさらに詳しく調べてください。