Набор данных DOTA128#

Name: Набор данных DOTA128 OBB
Creator: Ultralytics
License: https://captain-whu.github.io/DOTA/dataset.html
Keywords: Набор данных DOTA128, Ultralytics, YOLO26, обнаружение объектов, отладка, обучение моделей, обнаружение ориентированных объектов, YAML набора данных

Введение#

Ultralytics DOTA128 — это небольшой, но универсальный набор данных для обнаружения объектов с ориентированными рамками, состоящий из 128 изображений из набора DOTAv1 (128 для обучения и валидации). Этот набор данных идеально подходит для тестирования и отладки моделей с ориентированными ограничивающими рамками (OBB) или для экспериментов с новыми подходами к обнаружению. Имея всего 128 изображений, он достаточно мал, чтобы с ним было легко работать, и при этом достаточно разнообразен, чтобы тестировать конвейеры обучения на наличие ошибок и выполнять базовую проверку перед обучением на более крупных наборах данных.

Структура набора данных#

Изображения: 128 аэрофотоснимков (все находятся в папке train, используются как для обучения, так и для валидации), взятых из DOTAv1.
Классы: Наследует 15 категорий DOTAv1, таких как самолет, корабль и крупногабаритный транспорт.
Разметка: Ориентированные ограничивающие рамки в формате YOLO, сохраненные в файлах .txt рядом с каждым изображением.
Скачивание: 34 МБ, загружается автоматически из ресурсов GitHub компании Ultralytics при первом запуске обучения.

Этот набор данных предназначен для использования с Ultralytics Platform и YOLO26.

YAML набора данных#

Для определения конфигурации датасета используется YAML-файл. Он содержит информацию о путях к датасету, классах и другие соответствующие данные. В случае с датасетом DOTA128 файл dota128.yaml поддерживается по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

Использование#

Чтобы обучить модель YOLO26n-obb на наборе данных DOTA128 в течение 100 эпох с размером изображения 640, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Примеры изображений и аннотации#

Вот несколько примеров изображений из набора данных DOTA128 вместе с соответствующими аннотациями:

DOTA128 oriented bounding box dataset training mosaic

Мозаичное изображение: это изображение демонстрирует обучающий пакет, составленный из мозаично собранных изображений. Мозаика — это техника, используемая во время обучения, которая объединяет несколько изображений в одно, чтобы увеличить разнообразие объектов и сцен в каждом обучающем пакете. Это помогает улучшить способность модели к обобщению при работе с объектами различных размеров, соотношений сторон и контекстов.

Пример демонстрирует разнообразие и сложность изображений в наборе данных DOTA128, а также преимущества использования мозаики в процессе обучения.

Цитирование и благодарности#

Если ты используешь набор данных DOTA в своих исследованиях или разработках, пожалуйста, процитируй следующую статью:

Цитата

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2022},
  volume={44},
  number={11},
  pages={7778-7796},
  doi={10.1109/TPAMI.2021.3117983}
}

Особая благодарность команде, стоящей за наборами данных DOTA, за их похвальные усилия по созданию этого набора. Для исчерпывающего понимания набора данных и его нюансов, пожалуйста, посети официальный сайт DOTA.

FAQ#

Что такое набор данных DOTA128 и как его можно использовать?#

Набор данных DOTA128 — это универсальный набор данных для обнаружения ориентированных объектов, состоящий из 128 изображений из набора DOTAv1, которые хранятся в папке train. Обучение и валидация проводятся на одном и том же наборе изображений, что делает его идеальным для быстрой отладки и тестирования рабочих процессов. Он отлично подходит для тестирования и отладки OBB-моделей, таких как Ultralytics YOLO26. Благодаря удобному размеру и разнообразию, он помогает выявлять ошибки в конвейере и проводить санитарную проверку перед использованием более крупных наборов данных. Узнай больше об обнаружении OBB с помощью Ultralytics YOLO26.

Как обучить модель YOLO26, используя набор данных DOTA128?#

Чтобы обучить модель YOLO26n-obb на наборе данных DOTA128 в течение 100 эпох с размером изображения 640, ты можешь использовать следующие фрагменты кода. Полный список параметров смотри на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

Каковы ключевые особенности набора данных DOTA и где можно найти файл YAML?#

Набор данных DOTA известен как крупномасштабный бенчмарк, представляющий серьезные вызовы для обнаружения объектов на аэрофотоснимках. Подмножество DOTA128 обеспечивает большее разнообразие, чем DOTA8, оставаясь при этом удобным для начальных тестов. Ты можешь получить доступ к файлу dota128.yaml, который содержит пути, классы и детали конфигурации, по этой ссылке на GitHub.

Как DOTA128 соотносится с другими вариантами набора данных DOTA?#

DOTA128 (128 изображений) занимает промежуточное положение между DOTA8 (8 изображений) и полным набором DOTA-v1 (1 869 изображений) по размеру:

DOTA8: содержит всего 8 изображений (4 для обучения, 4 для валидации) — идеально для быстрых тестов и отладки.
DOTA128: содержит 128 изображений (все в папке train, используются как для обучения, так и для валидации) — баланс между объемом и разнообразием.
Полный DOTA-v1: содержит 1 869 изображений — всеобъемлющий, но ресурсоемкий.

DOTA128 — это хорошая «золотая середина», предлагающая большее разнообразие, чем DOTA8, при этом оставаясь гораздо более удобной в работе, чем полный набор данных DOTA, для экспериментов и начальной разработки моделей.

Как мозаика улучшает обучение моделей с набором данных DOTA128?#

Мозаика объединяет несколько изображений в одно во время обучения, увеличивая разнообразие объектов и контекстов в каждом батче. Это улучшает способность модели обобщать данные для объектов разных размеров, соотношений сторон и сцен. Эту технику можно наглядно продемонстрировать с помощью обучающего батча, состоящего из мозаичных изображений набора данных DOTA128, что способствует разработке более надежных моделей. Изучи подробнее методы мозаики и обучения на нашей странице Обучение.

Почему стоит использовать Ultralytics YOLO26 для задач обнаружения ориентированных объектов?#

Ultralytics YOLO26 обеспечивает передовые возможности обнаружения объектов в реальном времени, включая такие функции, как ориентированные ограничивающие рамки (OBB), сегментация экземпляров и высокоуниверсальный пайплайн обучения. Модель подходит для различных приложений и предлагает предобученные веса для эффективной донастройки (fine-tuning). Изучи подробнее преимущества и методы использования в документации Ultralytics YOLO26.

Участники

GLglenn-jocher² RAraimbekovm² LALaughing-q¹

Создано 4 месяца назадОбновлено 2 недели назад