Перейти к содержимому

Ultralytics Наборы данных HUB

Ultralytics Наборы данных HUB - это практичное решение для управления и использования твоих пользовательских наборов данных.

После загрузки наборов данных их можно сразу же использовать для обучения модели. Такой комплексный подход способствует плавному переходу от управления наборами данных к обучению моделей, значительно упрощая весь процесс.


Смотри: Смотри: Загрузка наборов данных на Ultralytics HUB | Полное описание функции загрузки наборов данных

Загрузите набор данных

Ultralytics Наборы данных HUB - это такие же наборы данных, как YOLOv5 и YOLOv8 🚀. Они используют ту же структуру и те же форматы меток, чтобы все было просто.

Прежде чем загружать набор данных на Ultralytics HUB, убедись, что ты поместил YAML-файл набора данных в корневой каталог набора данных и что YAML, каталог и ZIP имеют одинаковое имя, как показано в примере ниже, а затем застегни каталог набора данных.

Например, если твой набор данных называется "coco8", как у нас COCO8 пример набора данных, то у тебя должен быть coco8.yaml внутри твоего coco8/ В результате будет создан каталог coco8.zip когда застегнут:

zip -r coco8.zip coco8

Ты можешь скачать наш пример набора данных COCO8 и разархивировать его, чтобы увидеть, как именно нужно структурировать твой набор данных.

Структура набора данных COCO8

Набор данных YAML - это тот же стандартный формат YOLOv5 и YOLOv8 YAML.

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip

После того как ты заархивировал свой набор данных, тебе следует проверить его перед загрузкой на Ultralytics HUB. Ultralytics HUB проводит проверку достоверности набора данных после загрузки, поэтому, если ты заранее убедишься, что твой набор данных правильно отформатирован и не содержит ошибок, ты сможешь избежать любых неудач, связанных с отказом в приеме данных.

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Когда ZIP твоего набора данных будет готов, перейди на страницу Datasets, нажав на кнопку Datasets в боковой панели, и нажми на кнопку Upload Dataset в правом верхнем углу страницы.

Ultralytics Скриншот HUB страницы Datasets со стрелкой, указывающей на кнопку Datasets в боковой панели, и стрелкой, указывающей на кнопку Upload Dataset

Наконечник

Ты можешь загрузить набор данных прямо с главной страницы.

Ultralytics Скриншот главной страницы HUB со стрелкой, указывающей на карточку Upload Dataset

Это действие вызовет диалоговое окно Upload Dataset.

Выбери задание своего набора данных и загрузи его в поле Dataset .zip file.

У тебя есть дополнительная возможность задать пользовательское имя и описание для своего набора данных Ultralytics HUB.

Когда ты будешь доволен конфигурацией своего набора данных, нажми кнопку Upload.

Ultralytics Скриншот HUB диалога Upload Dataset со стрелками, указывающими на задачу датасета, файл датасета и кнопку Upload

После того как твой набор данных будет загружен и обработан, ты сможешь получить к нему доступ со страницы Datasets.

Ultralytics Скриншот страницы "Датасеты" в HUB со стрелкой, указывающей на один из датасетов

Ты можешь просмотреть изображения в твоем наборе данных, сгруппированные по сплитам (Train, Validation, Test).

Ultralytics Скриншот страницы Dataset в HUB со стрелкой, указывающей на вкладку Images

Наконечник

Каждое изображение можно увеличить для лучшей визуализации.

Ultralytics Скриншот HUB вкладки Images на странице Dataset со стрелкой, указывающей на значок расширения

Ultralytics Скриншот HUB вкладки Images на странице Dataset с развернутым одним из изображений

Кроме того, ты можешь проанализировать свой набор данных, перейдя на вкладку " Обзор ".

Ultralytics Скриншот страницы "Датасет" в HUB со стрелкой, указывающей на вкладку "Обзор

Далее обучи модель на своем наборе данных.

Ultralytics Скриншот страницы Dataset в HUB со стрелкой, указывающей на кнопку Train Model

Поделись набором данных

Информация

Ultralytics Функция обмена данными вHUB предоставляет удобный способ делиться наборами данных с другими людьми. Эта функция рассчитана как на существующих пользователей Ultralytics HUB, так и на тех, кто еще не создал аккаунт.

Примечание

У тебя есть контроль над общим доступом к твоим наборам данных.

Ты можешь установить для общего доступа значение "Private", в этом случае доступ к нему будет только у тебя. В качестве альтернативы ты можешь установить общий доступ на "Unlisted", что предоставит доступ к просмотру любому, кто имеет прямую ссылку на набор данных, независимо от того, есть у него аккаунт на Ultralytics HUB или нет.

Перейди на страницу Dataset того набора данных, которым ты хочешь поделиться, открой выпадающий список действий с набором данных и щелкни по опции Share. Это действие вызовет диалог Share Dataset.

Ultralytics Скриншот страницы "Датасет" в HUB со стрелкой, указывающей на опцию "Поделиться

Наконечник

Ты можешь поделиться набором данных прямо со страницы Datasets.

Ultralytics Скриншот HUB страницы "Наборы данных" со стрелкой, указывающей на опцию "Поделиться" одного из наборов данных

Установи общий доступ на "Unlisted" и нажми Save.

Ultralytics Скриншот HUB диалогового окна Share Dataset со стрелкой, указывающей на выпадающий список, и стрелкой, указывающей на кнопку Save

Теперь любой, у кого есть прямая ссылка на твой набор данных, сможет просмотреть его.

Наконечник

Ты можешь легко нажать на ссылку набора данных, показанную в диалоге Share Dataset, чтобы скопировать его.

Ultralytics Скриншот HUB с диалоговым окном Share Dataset со стрелкой, указывающей на ссылку на набор данных

Редактировать набор данных

Перейди на страницу Dataset того набора данных, который ты хочешь отредактировать, открой выпадающий список действий с набором данных и щелкни по опции Edit. Это действие вызовет диалог обновления набора данных.

Ultralytics Скриншот страницы "Датасет" в HUB со стрелкой, указывающей на опцию "Редактировать

Наконечник

Ты можешь редактировать набор данных прямо со страницы Datasets.

Ultralytics Скриншот HUB страницы "Наборы данных" со стрелкой, указывающей на опцию "Редактировать" одного из наборов данных

Примени нужные модификации к своему набору данных, а затем подтверди изменения, нажав кнопку Save.

Ultralytics Скриншот HUB диалогового окна Update Dataset со стрелкой, указывающей на кнопку Save

Удалить набор данных

Перейди на страницу Dataset того набора данных, который ты хочешь удалить, открой выпадающий список действий с набором данных и щелкни по опции Delete. Это действие приведет к удалению набора данных.

Ultralytics Скриншот страницы "Датасет" в HUB со стрелкой, указывающей на опцию "Удалить

Наконечник

Ты можешь удалить набор данных прямо со страницы Datasets.

Ultralytics Скриншот HUB страницы "Наборы данных" со стрелкой, указывающей на опцию "Удалить" одного из наборов данных

Примечание

Если ты передумаешь, то сможешь восстановить набор данных со страницы " Корзина".

Ultralytics Скриншот страницы "Корзина" в HUB со стрелкой, указывающей на кнопку "Корзина" в боковой панели, и стрелкой, указывающей на опцию "Восстановить" одного из наборов данных



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5), sergiuwaxmann (2), Burhan-Q (1), priytosh-tripathi (1), RizwanMunawar (1), Laughing-q (1)

Комментарии