Перейти к содержимому

HUB Наборы данных

Ultralytics HUB наборы данных - это практичное решение для управления и использования твоих пользовательских наборов данных.

После загрузки наборов данных их можно сразу же использовать для обучения модели. Такой комплексный подход способствует плавному переходу от управления наборами данных к обучению моделей, значительно упрощая весь процесс.



Смотри: Смотри: Загрузка наборов данных на Ultralytics HUB | Полное описание функции загрузки наборов данных.

Загрузите набор данных

Ultralytics HUB Такие же наборы данных, как YOLOv5 и YOLOv8 🚀. Они используют ту же структуру и те же форматы меток, чтобы все было просто.

Прежде чем загружать набор данных на Ultralytics HUB , убедись, что ты поместил YAML-файл набора данных в корневой каталог набора данных и что YAML, каталог и ZIP имеют одинаковое имя, как показано в примере ниже, а затем застегни каталог набора данных.

Например, если твой набор данных называется "coco8", как у нас COCO8 пример набора данных, то у тебя должен быть coco8.yaml внутри твоего coco8/ В результате будет создан каталог coco8.zip когда застегнут:

zip -r coco8.zip coco8

Ты можешь скачать наш пример набора данных COCO8 и разархивировать его, чтобы увидеть, как именно нужно структурировать твой набор данных.

Структура набора данных COCO8

Набор данных YAML - это тот же стандартный формат YOLOv5 и YOLOv8 YAML.

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip

После того как ты заархивировал свой набор данных, тебе следует проверить его перед загрузкой на Ultralytics HUB . Ultralytics HUB проводит проверку достоверности набора данных после загрузки, поэтому, убедившись, что твой набор данных правильно отформатирован и не содержит ошибок, ты сможешь предотвратить любые неудачи, связанные с отклонением набора данных.

from ultralytics.hub import check_dataset

check_dataset('path/to/coco8.zip')

Когда ZIP твоего набора данных будет готов, перейди на страницу Datasets, нажав на кнопку Datasets в боковой панели.

Ultralytics HUB Скриншот главной страницы со стрелкой, указывающей на кнопку Datasets в боковой панели

Нажми на кнопку Upload Dataset в правом верхнем углу страницы. Это действие вызовет диалоговое окно Upload Dataset.

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на кнопку Upload Dataset

Загрузи свой набор данных в поле Dataset .zip file.

У тебя есть дополнительная возможность задать пользовательское название и описание для своего набора данных Ultralytics HUB .

Когда ты будешь доволен конфигурацией своего набора данных, нажми кнопку Upload.

Ultralytics HUB Скриншот диалогового окна Upload Dataset со стрелкой, указывающей на кнопку Upload

После того как твой набор данных будет загружен и обработан, ты сможешь получить к нему доступ со страницы Datasets.

Ultralytics HUB Скриншот страницы Datasets со стрелкой, указывающей на один из наборов данных

Ты можешь просмотреть изображения в твоем наборе данных, сгруппированные по сплитам (Train, Validation, Test).

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на вкладку Images

Наконечник

Каждое изображение можно увеличить для лучшей визуализации.

Ultralytics HUB Скриншот вкладки Images на странице Dataset со стрелкой, указывающей на значок расширения

Ultralytics HUB Скриншот вкладки Images на странице Dataset с развернутым одним из изображений

Кроме того, ты можешь проанализировать свой набор данных, перейдя на вкладку " Обзор ".

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на вкладку Overview

Далее обучи модель на своем наборе данных.

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на кнопку Train Model

Поделись набором данных

Информация

Ultralytics HUBФункция обмена данными предоставляет удобный способ делиться наборами данных с другими людьми. Эта функция рассчитана как на существующих пользователей Ultralytics HUB , так и на тех, кто еще не создал аккаунт.

Примечание

У тебя есть контроль над общим доступом к твоим наборам данных.

Ты можешь установить для общего доступа значение "Private", в этом случае доступ к нему будет только у тебя. В качестве альтернативы ты можешь установить общий доступ на "Unlisted", что предоставит доступ к просмотру любому, кто имеет прямую ссылку на набор данных, независимо от того, есть у него аккаунт на Ultralytics HUB или нет.

Перейди на страницу Dataset того набора данных, которым ты хочешь поделиться, открой выпадающий список действий с набором данных и щелкни по опции Share. Это действие вызовет диалог Share Dataset.

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на опцию Share

Наконечник

Ты также можешь поделиться набором данных прямо со страницы Datasets.

Ultralytics HUB Скриншот страницы Datasets со стрелкой, указывающей на опцию Share одного из наборов данных

Установи общий доступ на "Unlisted" и нажми Save.

Ultralytics HUB Скриншот диалога Share Dataset со стрелкой, указывающей на выпадающий список, и стрелкой, указывающей на кнопку Save

Теперь любой, у кого есть прямая ссылка на твой набор данных, сможет его просмотреть.

Наконечник

Ты можешь легко нажать на ссылку набора данных, показанную в диалоге Share Dataset, чтобы скопировать его.

Ultralytics HUB Скриншот диалога Share Dataset со стрелкой, указывающей на ссылку на набор данных

Редактирование / удаление набора данных

Перейди на страницу Dataset того набора данных, который ты хочешь отредактировать, открой выпадающий список действий с набором данных и щелкни по опции Edit. Это действие вызовет диалог обновления набора данных.

Ultralytics HUB Скриншот страницы Dataset со стрелкой, указывающей на опцию редактирования и удаления

Примени нужные модификации к своему набору данных, а затем подтверди изменения, нажав кнопку Save.

Перейди на страницу Dataset того набора данных, который ты хочешь удалить, открой выпадающий список действий с набором данных и щелкни по опции Delete. Это действие приведет к удалению набора данных.

Примечание

Если ты передумаешь, то сможешь восстановить набор данных со страницы " Корзина".

Ultralytics HUB Скриншот страницы "Корзина" со стрелкой, указывающей на опцию "Восстановить" одного из наборов данных



Создано 2023-11-12, Обновлено 2024-02-13
Авторы: glenn-jocher (4), priytosh-tripathi (1), chr043416@gmail.com (1), sergiuwaxmann (1), Laughing-q (1)

Комментарии