Skip to main content

DOTA128 データセット

はじめに

Ultralytics DOTA128は、DOTAv1セットから128枚の画像で構成された、小規模ながら多目的な物体検出データセットです。訓練と検証に128枚の画像を使用します。このデータセットは、方向付き境界ボックス(OBB)モデルのテストとデバッグ、または新しい検出アプローチの実験に最適です。128枚の画像と小規模なため管理が容易であり、かつ多様性を持ち、訓練パイプラインのエラーテストや、大規模データセットの訓練前のサニティチェックとして機能します。

データセット構造

  • 画像: DOTAv1から取得した128枚の航空タイル(すべてtrainフォルダに格納され、訓練と検証の両方に使用)。
  • クラス: 飛行機、船、大型車両などのDOTAv1の15カテゴリを継承。
  • ラベル: 各画像の隣に.txtファイルとして保存されたYOLO形式の方向付き境界ボックス。

このデータセットは、Ultralytics PlatformおよびYOLO26での使用を目的としています。

データセット YAML

YAML(Yet Another Markup Language)ファイルは、データセットの設定を定義するために使用されます。データセットのパス、クラス、その他の関連情報が含まれています。DOTA128データセットの場合、dota128.yamlファイルはhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yamlにて管理されています。

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

使用方法

DOTA128データセットでYOLO26n-obbモデルを画像サイズ640、100エポックで訓練するには、以下のコードスニペットを使用してください。利用可能な引数の詳細については、モデルのトレーニングページをご参照ください。

訓練例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

サンプル画像とアノテーション

DOTA128データセットの画像例とそれに対応するアノテーションを以下に示します。

DOTA128 oriented bounding box dataset training mosaic
  • モザイク画像: この画像は、モザイク化されたデータセット画像で構成された訓練バッチを示しています。モザイク化は、訓練中に複数の画像を1枚の画像に組み合わせる手法で、各訓練バッチ内の物体とシーンの多様性を高めます。これにより、モデルが異なる物体サイズ、アスペクト比、コンテキストへの汎化能力が向上します。

この例は、DOTA128データセットの画像の多様性と複雑さ、および訓練プロセスにおけるモザイク化の利点を示しています。

引用および謝辞

研究や開発作業でDOTAデータセットを使用する場合は、以下の論文を引用してください。

Quote
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

DOTAデータセットのチームが本データセットのキュレーションに尽力されたことに、特別な感謝を申し上げます。データセットとその詳細について深く理解するには、DOTAの公式ウェブサイトをご参照ください。

よくある質問

DOTA128データセットとは何ですか?また、どのように使用できますか?

DOTA128データセットは、DOTAv1セットから128枚の画像で構成された多目的な方向付き物体検出データセットで、すべてtrainフォルダに格納されています。訓練と検証の両方で同じ画像セットを使用するため、クイックテストとデバッグワークフローに最適です。Ultralytics YOLO26のようなOBBモデルのテストとデバッグに適しています。管理しやすいサイズと多様性により、パイプラインエラーの特定や大規模データセット展開前のサニティチェックに役立ちます。Ultralytics YOLO26でのOBB検出について詳しくご覧ください。

DOTA128データセットを使用してYOLO26モデルを訓練するにはどうすればよいですか?

DOTA128データセットでYOLO26n-obbモデルを画像サイズ640、100エポックで訓練するには、以下のコードスニペットを使用してください。引数の詳細については、モデルのトレーニングページをご参照ください。

訓練例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

DOTAデータセットの主な特徴と、YAMLファイルへのアクセス方法は?

DOTAデータセットは、航空画像における物体検出の大規模ベンチマークとその課題で知られています。DOTA128サブセットは、DOTA8より多様性を提供しながら、初期テストに管理しやすいサイズを維持しています。パス、クラス、設定の詳細を含むdota128.yamlファイルは、GitHubリンクからアクセスできます。

DOTA128は他のDOTAデータセットバリアントとどのように比較されますか?

DOTA128(128枚の画像)は、サイズの面でDOTA8(8枚の画像)と完全なDOTA-v1データセット(1,869枚の画像)の間に位置します。

  • DOTA8: わずか8枚の画像(訓練4枚、検証4枚)—クイックテストとデバッグに最適
  • DOTA128: 128枚の画像(すべてtrainフォルダに格納され、訓練と検証の両方に使用)—サイズと多様性のバランスが取れている
  • 完全なDOTA-v1: 1,869枚の画像—包括的だがリソース集約的

DOTA128は、DOTA8より多様性を提供しながら、実験や初期モデル開発において完全なDOTAデータセットより管理しやすいという良いバランスを提供します。

モザイク化はDOTA128データセットを使用したモデル訓練をどのように向上させますか?

モザイク化は、訓練中に複数の画像を1枚に組み合わせ、各バッチ内の物体とコンテキストの多様性を高めます。これにより、モデルが異なる物体サイズ、アスペクト比、シーンへの汎化能力が向上します。この手法は、モザイク化されたDOTA128データセット画像で構成された訓練バッチを通じて視覚的に示すことができ、堅牢なモデル開発に役立ちます。モザイク化と訓練技術の詳細については、トレーニングページをご覧ください。

方向付き物体検出タスクにUltralytics YOLO26を使用すべき理由は?

Ultralytics YOLO26は、方向付き境界ボックス(OBB)、インスタンスセグメンテーション、高度に多目的な訓練パイプラインなどの機能を含む、最先端のリアルタイム物体検出機能を提供します。さまざまなアプリケーションに適しており、効率的なファインチューニングのための事前学習済みモデルを提供します。利点と使用方法の詳細については、Ultralytics YOLO26ドキュメントをご参照ください。

コメント