Meet YOLO26: next-gen vision AI.

Link to this sectionDOTA128 データセット#

Link to this sectionはじめに#

Ultralytics DOTA128は、DOTAv1セットから抽出された128枚の画像(トレーニング用と検証用に各128枚)で構成される、小規模ながら多目的に利用可能なオブジェクト検出データセットです。このデータセットは、指向性バウンディングボックス(OBB)モデルのテストやデバッグ、あるいは新しい検出手法の実験に最適です。128枚という小規模な構成のため管理が容易である一方、トレーニングパイプラインのエラーテストや、より大規模なデータセットでトレーニングを行う前の健全性チェックに適した多様性を備えています。

Link to this sectionデータセットの構造#

  • 画像: 128枚の航空写真タイル(すべてtrainフォルダに格納され、トレーニングと検証の両方に使用されます)。DOTAv1から取得。
  • クラス: plane(飛行機)、ship(船舶)、large vehicle(大型車両)など、DOTAv1の15カテゴリを継承しています。
  • ラベル: 各画像の横に保存された.txtファイル形式のYOLO形式の指向性バウンディングボックス。

このデータセットは、Ultralytics PlatformおよびYOLO26での使用を想定しています。

Link to this sectionデータセット YAML#

データセットの設定定義にはYAML(Yet Another Markup Language)ファイルが使用されます。これには、データセットのパス、クラス、その他の関連情報が含まれます。DOTA128データセットの場合、dota128.yamlファイルは https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml で管理されています。

ultralytics/cfg/datasets/dota128.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Link to this section使用方法#

DOTA128データセット上でYOLO26n-obbモデルを画像サイズ640で100エポックトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の完全なリストについては、モデルのトレーニングページを参照してください。

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Link to this sectionサンプル画像とアノテーション#

以下は、DOTA128データセットの画像と、それに対応するアノテーションの例です。

DOTA128 oriented bounding box dataset training mosaic
  • モザイク画像: この画像は、モザイク処理されたデータセット画像で構成されるトレーニングバッチを示しています。モザイク処理は、トレーニング中に複数の画像を1つの画像に結合し、各トレーニングバッチ内のオブジェクトやシーンの多様性を高める技術です。これにより、さまざまなオブジェクトのサイズ、アスペクト比、およびコンテキストに対してモデルが汎化する能力を向上させます。

この例では、DOTA128データセットにおける画像の多様性と複雑さ、およびトレーニングプロセス中にモザイク処理を使用するメリットを示しています。

Link to this section引用と謝辞#

研究や開発でDOTAデータセットを使用する場合は、以下の論文を引用してください。

引用
@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

このデータセットをキュレーションするという称賛に値する努力をしてくれた DOTA データセットの背後にいるチームに心から感謝いたします。データセットとそのニュアンスの詳細については、DOTA 公式ウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionDOTA128データセットとは何であり、どのように使用できますか?#

DOTA128データセットは、DOTAv1セットの128枚の画像で構成される多目的な指向性オブジェクト検出データセットであり、すべてtrainフォルダに保存されています。トレーニングと検証の両方に同じ画像セットを使用するため、迅速なテストやデバッグのワークフローに最適です。Ultralytics YOLO26のようなOBBモデルのテストやデバッグに適しています。管理しやすいサイズと多様性を備えているため、より大規模なデータセットを展開する前のパイプラインエラーの特定や健全性チェックに役立ちます。Ultralytics YOLO26でのOBB検出の詳細をご覧ください。

Link to this sectionDOTA128データセットを使用してYOLO26モデルをトレーニングするにはどうすればよいですか?#

DOTA128データセット上でYOLO26n-obbモデルを画像サイズ640で100エポックトレーニングするには、以下のコードスニペットを使用できます。引数の詳細なオプションについては、モデルのトレーニングページを参照してください。

学習例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Link to this sectionDOTAデータセットの主な特徴は何ですか?また、YAMLファイルにはどこからアクセスできますか?#

DOTAデータセットは、大規模なベンチマークと、航空画像におけるオブジェクト検出の課題を提供することで知られています。DOTA128サブセットは、DOTA8よりも多様性があり、かつ初期テストに適した管理可能なサイズです。パス、クラス、設定詳細を含むdota128.yamlファイルには、このGitHubリンクからアクセスできます。

Link to this sectionDOTA128は他のDOTAデータセットのバリエーションとどのように異なりますか?#

DOTA128(128枚の画像)は、サイズに関してDOTA8(8枚の画像)と完全なDOTA-v1データセット(1,869枚の画像)の中間に位置します。

  • DOTA8: わずか8枚の画像(トレーニング4枚、検証4枚)を含み、迅速なテストやデバッグに最適です。
  • DOTA128: 128枚の画像(すべてtrainフォルダに格納され、トレーニングと検証の両方に使用されます)を含み、サイズと多様性のバランスが取れています。
  • 完全なDOTA-v1: 1,869枚の画像を含み、包括的ですがリソースを大量に消費します。

DOTA128は優れた中間地点を提供し、実験や初期モデル開発において、DOTA8よりも多様性があり、完全なDOTAデータセットよりも大幅に管理しやすくなっています。

Link to this sectionモザイク処理はDOTA128データセットを使用したモデルトレーニングをどのように強化しますか?#

モザイク処理はトレーニング中に複数の画像を1つに結合し、各バッチ内のオブジェクトとコンテキストの多様性を高めます。これにより、さまざまなオブジェクトサイズ、アスペクト比、シーンに対して汎化するモデルの能力が向上します。この手法は、モザイク処理されたDOTA128データセット画像で構成されるトレーニングバッチを通じて視覚的に実証でき、堅牢なモデル開発に役立ちます。モザイク処理やトレーニング手法の詳細については、当社のトレーニングページをご覧ください。

Link to this section指向性オブジェクト検出タスクにUltralytics YOLO26を使用すべき理由は何ですか?#

Ultralytics YOLO26は、指向性バウンディングボックス (OBB)、instance segmentation(インスタンスセグメンテーション)、そして非常に汎用性の高い学習パイプラインなどの機能を備えた、最先端のリアルタイム物体検出機能を提供します。さまざまなアプリケーションに適しており、効率的なファインチューニングが可能な事前学習済みモデルも提供しています。利点や使用方法の詳細については、Ultralytics YOLO26 documentationをご覧ください。

コントリビューター

コメント