DOTA128 データセット

はじめに

Ultralytics DOTA128は、小規模ながら多目的に活用できる指向性物体検出 データセットであり、DOTAv1セットから抽出された128枚の画像で構成されています(トレーニング用128枚、バリデーション用128枚)。このデータセットは、指向性バウンディングボックス(OBB)モデルのテストやデバッグ、また新しい検出アプローチの実験に最適です。128枚という画像数は、管理が容易でありながら、トレーニングパイプラインのエラーチェックや大規模なデータセットで学習を行う前の健全性確認(サニティチェック)を行うには十分な多様性を備えています。

データセット構成

  • 画像: DOTAv1から取得した128枚の航空写真タイル(すべてtrainフォルダ内にあり、トレーニングとバリデーションの両方に使用)。
  • クラス: 飛行機、船、大型車両など、DOTAv1の15カテゴリを継承。
  • ラベル: YOLO形式の指向性バウンディングボックスが、各画像に対応する.txt ファイルとして保存されています。

このデータセットは、以下で使用することを目的としています。Ultralytics PlatformYOLO26.

データセットYAML

YAML(Yet Another Markup Language)ファイルは、データセットの構成を定義するために使用されます。これには、データセットのパス、クラス、その他の関連情報が含まれます。DOTA128データセットの場合、dota128.yamlファイルは以下の場所で管理されています:https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

使用方法

DOTA128データセットでYOLO26n-obbモデルを100エポックエポック、画像サイズ640でトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルのトレーニング ページを参照してください。

トレーニング例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

サンプル画像とアノテーション

DOTA128データセットの画像例と、それに対応するアノテーションを以下に示します。

DOTA128 oriented bounding box dataset training mosaic
  • モザイク画像:この画像は、モザイク処理されたデータセット画像で構成される学習バッチを示しています。モザイク処理は学習中に使用される手法で、複数の画像を1つの画像に結合することで、各学習バッチ内の物体やシーンの多様性を高めます。これは、モデルが異なる物体のサイズ、アスペクト比、コンテキストに対して汎化する能力を向上させるのに役立ちます。

この例では、DOTA128データセットの画像の多様性と複雑さ、およびトレーニングプロセス中にモザイク処理を使用するメリットを紹介しています。

引用と謝辞

研究や開発の業務でDOTAデータセットを使用する場合は、以下の論文を引用してください:

引用
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

DOTAデータセットをキュレートするための賞賛に値する取り組みを行ったチームに深く感謝いたします。データセットとその詳細について包括的に理解するには、公式DOTAウェブサイト.

プロジェクトや実験を進める過程でこれらの設定を適宜見直し、最適な構成を維持してください。

DOTA128データセットとは何ですか、またどのように使用できますか?

DOTA128データセットは、DOTAv1セットの128枚の画像で構成される多目的な指向性物体検出データセットであり、すべてtrainフォルダに格納されています。トレーニングとバリデーションの両方に同じ画像セットを使用するため、迅速なテストやデバッグのワークフローに最適です。Ultralytics YOLO26のようなOBBモデルのテストとデバッグに適しています。管理しやすいサイズと多様性により、パイプラインのエラー特定や、大規模なデータセットを展開する前の健全性確認(サニティチェック)に役立ちます。OBB検出の詳細については、Ultralytics YOLO26.

DOTA128データセットを使用してYOLO26モデルを学習するにはどうすればよいですか?

DOTA128データセットでYOLO26n-obbモデルを100エポック、画像サイズ640で学習するには、以下のコードスニペットを使用できます。詳細な引数オプションについては、モデルのトレーニング ページを参照してください。

トレーニング例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

DOTAデータセットの主な特徴は何ですか、またYAMLファイルにはどこからアクセスできますか?

DOTAデータセットは、その大規模なベンチマークと、航空画像における物体検出の課題で知られています。DOTA128サブセットは、DOTA8よりも多様性が高く、初期テストにも適した管理しやすいサイズです。パス、クラス、構成の詳細を含むdota128.yaml ファイルには、以下のGitHubリンク.

DOTA128は他のDOTAデータセットのバリエーションと比べてどうですか?

DOTA128(128枚の画像)は、サイズ的にDOTA8 (8枚の画像)と完全な DOTA-v1 データセット(1,869枚の画像)の中間に位置します:

  • DOTA8: わずか8枚の画像(学習4枚、検証4枚)で構成 - 迅速なテストやデバッグに最適
  • DOTA128: 128枚の画像を収録(すべてtrainフォルダ内、トレーニングとバリデーションの両方に使用) - サイズと多様性のバランスが取れています
  • Full DOTA-v1: 1,869枚の画像を収録 - 包括的ですがリソースを多く消費します

DOTA128は優れた中間地点であり、DOTA8よりも高い多様性を提供しつつ、フルバージョンのDOTAデータセットよりも実験や初期のモデル開発において扱いやすくなっています。

モザイク処理は、DOTA128データセットでのモデル学習をどのように強化しますか?

モザイク処理は、トレーニング中に複数の画像を1つに組み合わせることで、各バッチ内のオブジェクトやコンテキストの多様性を高めます。これにより、さまざまなオブジェクトサイズ、アスペクト比、シーンに対して汎化するモデルの能力が向上します。この手法は、モザイク処理されたDOTA128データセットの画像で構成されたトレーニングバッチを通じて視覚的に示すことができ、堅牢なモデル開発に役立ちます。モザイク処理やトレーニング技術の詳細については、当社のトレーニング ページを参照してください。

指向性物体検出タスクにUltralytics YOLO26を使用すべき理由は何ですか?

Ultralytics YOLO26は、最先端のリアルタイム物体検出機能を提供しており、指向性バウンディングボックス(OBB)機能、インスタンスセグメンテーション、そして非常に多目的なトレーニングパイプラインを備えています。さまざまなアプリケーションに適しており、効率的なファインチューニングが可能な事前学習済みモデルも提供されています。利点や使用法の詳細については、Ultralytics YOLO26のドキュメント.

コメント