DOTA8 データセット

はじめに

Ultralytics DOTA8は、splitされたDOTAv1セットの最初の8枚の画像(学習用4枚、検証用4枚)で構成される、小規模ながらも多目的な指向性物体検出データセットです。このデータセットは、物体検出モデルのテストやデバッグ、あるいは新しい検出アプローチの実験に最適です。わずか8枚の画像で構成されているため管理が容易でありながら、トレーニングパイプラインのエラーチェックや、より大規模なデータセットで学習を行う前のサニティチェック(健全性確認)を行うには十分な多様性を備えています。

データセットの構造

  • 画像: DOTAv1から取得した8枚の空中写真タイル(学習用4枚、検証用4枚)。

  • クラス: 飛行機、船舶、大型車両など、DOTAv1の15カテゴリを継承しています。

  • ラベル: 各画像の横に.txtファイルとして保存されたYOLO形式の指向性バウンディングボックス。

  • 推奨されるレイアウト:

    datasets/dota8/
    ├── images/
    │   ├── train/
    │   └── val/
    └── labels/
        ├── train/
        └── val/

このデータセットは、Ultralytics Platform および YOLO26 での使用を想定しています。

データセットYAML

YAML(Yet Another Markup Language)ファイルは、データセットの設定を定義するために使用されます。これには、データセットのパス、クラス、およびその他の関連情報が含まれます。DOTA8データセットの場合、dota8.yamlファイルはhttps://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota8.yamlで管理されています。

ultralytics/cfg/datasets/dota8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA8 dataset (8 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota8/
# Example usage: yolo train model=yolov8n-obb.pt data=dota8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota8.zip

使用方法

DOTA8データセットでYOLO26n-obbモデルを画像サイズ640で100エポック学習させるには、以下のコードスニペットを使用できます。利用可能な引数の詳細リストについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

サンプル画像とアノテーション

DOTA8データセットの画像の例と、それに対応するアノテーションを以下に示します。

DOTA8 oriented bounding box dataset training mosaic
  • モザイク画像: この画像は、モザイク処理されたデータセット画像で構成される学習バッチを示しています。モザイク処理は、学習中に複数の画像を1枚の画像に結合し、各学習バッチ内の物体やシーンの多様性を高めるために使用される手法です。これは、異なる物体のサイズ、アスペクト比、コンテキストに対してモデルが汎化する能力を向上させるのに役立ちます。

この例では、DOTA8データセットの画像の多様性と複雑さ、および学習プロセス中にモザイク処理を使用する利点を紹介しています。

引用と謝辞

研究や開発作業でDOTAデータセットを使用する場合は、以下の論文を引用してください:

引用
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

このデータセットをキュレーションする上で称賛に値する努力をされた、DOTAデータセットの背後にいるチームに心から感謝いたします。データセットとそのニュアンスの詳細については、公式DOTAウェブサイトをご覧ください。

FAQ

DOTA8データセットとは何ですか、またどのように使用できますか?

DOTA8データセットは、splitされたDOTAv1セットの最初の8枚の画像で構成される、小規模で多目的な指向性物体検出データセットです(学習用に4枚、検証用に4枚を割り当てています)。これはUltralytics YOLO26のような物体検出モデルのテストやデバッグに最適です。扱いやすいサイズと多様性により、より大規模なデータセットを展開する前のパイプラインエラーの特定やサニティチェックに役立ちます。Ultralytics YOLO26を使用した物体検出の詳細をご覧ください。

DOTA8データセットを使用してYOLO26モデルを学習するにはどうすればよいですか?

DOTA8データセットでYOLO26n-obbモデルを100エポック、画像サイズ640で学習させるには、以下のコードスニペットを使用できます。包括的な引数のオプションについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota8.yaml", epochs=100, imgsz=640)

DOTAデータセットの主な特徴は何ですか、またYAMLファイルにはどこからアクセスできますか?

DOTAデータセットは、その大規模なベンチマークと、空中画像における物体検出が直面する課題で知られています。DOTA8サブセットは、初期テストに最適な、小規模で扱いやすいデータセットです。パス、クラス、設定の詳細が含まれるdota8.yamlファイルには、このGitHubリンクからアクセスできます。

モザイク処理は、DOTA8データセットでのモデル学習をどのように強化しますか?

モザイク処理は、学習中に複数の画像を1つに組み合わせることで、各バッチ内のオブジェクトやコンテキストの多様性を高めます。これにより、さまざまなオブジェクトのサイズ、アスペクト比、シーンに対するモデルの汎化能力が向上します。この手法は、モザイク処理されたDOTA8データセット画像で構成される学習バッチを通じて視覚的に実証でき、堅牢なモデル開発に役立ちます。モザイク処理やトレーニング手法の詳細については、当社のトレーニングページをご覧ください。

なぜ物体検出タスクにUltralytics YOLO26を使用すべきなのですか?

Ultralytics YOLO26は、最先端のリアルタイム物体検出機能を提供します。これには、指向性バウンディングボックス(OBB)、インスタンスセグメンテーション、および非常に汎用性の高いトレーニングパイプラインが含まれます。さまざまなアプリケーションに適しており、効率的なファインチューニングのための事前学習済みモデルも提供しています。利点や使用方法の詳細については、Ultralytics YOLO26ドキュメントをご覧ください。

コメント