Наборы данных HUB
Ultralytics Наборы данных HUB - это практичное решение для управления и использования твоих пользовательских наборов данных.
После загрузки наборов данных их можно сразу же использовать для обучения модели. Такой комплексный подход способствует плавному переходу от управления наборами данных к обучению моделей, значительно упрощая весь процесс.
Смотри: Смотри: Загрузка наборов данных на Ultralytics HUB | Полное описание функции загрузки наборов данных
Загрузите набор данных
Наборы данных Ultralytics HUB - это такие же наборы данных, как YOLOv5 и YOLOv8 🚀. Они используют ту же структуру и те же форматы меток, чтобы все было просто.
Прежде чем загружать набор данных на Ultralytics HUB, убедись, что ты поместил YAML-файл набора данных в корневой каталог набора данных и что YAML, каталог и ZIP имеют одинаковое имя, как показано в примере ниже, а затем застегни каталог набора данных.
Например, если твой набор данных называется "coco8", как у нас COCO8 пример набора данных, то у тебя должен быть coco8.yaml
внутри твоего coco8/
В результате будет создан каталог coco8.zip
когда застегнут:
Ты можешь скачать наш пример набора данных COCO8 и разархивировать его, чтобы увидеть, как именно нужно структурировать твой набор данных.
Набор данных YAML - это тот же стандартный формат YOLOv5 и YOLOv8 YAML.
coco8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip
После того как ты запечатал свой набор данных, тебе следует проверить его перед загрузкой в Ultralytics HUB. Ultralytics HUB проводит проверку валидности набора данных после загрузки, поэтому, заранее убедившись, что твой набор данных правильно отформатирован и не содержит ошибок, ты сможешь предотвратить любые неудачи, связанные с отклонением набора данных.
Когда ZIP твоего набора данных будет готов, перейди на страницу Datasets, нажав на кнопку Datasets в боковой панели.
Нажми на кнопку Upload Dataset в правом верхнем углу страницы. Это действие вызовет диалоговое окно Upload Dataset.
Загрузи свой набор данных в поле Dataset .zip file.
У тебя есть дополнительная возможность задать пользовательское имя и описание для своего набора данных Ultralytics HUB.
Когда ты будешь доволен конфигурацией своего набора данных, нажми кнопку Upload.
После того как твой набор данных будет загружен и обработан, ты сможешь получить к нему доступ со страницы Datasets.
Ты можешь просмотреть изображения в твоем наборе данных, сгруппированные по сплитам (Train, Validation, Test).
Наконечник
Каждое изображение можно увеличить для лучшей визуализации.
Кроме того, ты можешь проанализировать свой набор данных, перейдя на вкладку " Обзор ".
Далее обучи модель на своем наборе данных.
Поделись набором данных
Информация
Функция обмена данными в Ultralytics HUB предоставляет удобный способ делиться наборами данных с другими людьми. Эта функция рассчитана как на существующих пользователей Ultralytics HUB, так и на тех, кто еще не создал аккаунт.
Примечание
У тебя есть контроль над общим доступом к твоим наборам данных.
Ты можешь установить для общего доступа значение "Private", в этом случае доступ к нему будет только у тебя. В качестве альтернативы ты можешь установить общий доступ на "Unlisted", что предоставит доступ к просмотру любому, кто имеет прямую ссылку на набор данных, независимо от того, есть у него аккаунт Ultralytics HUB или нет.
Перейди на страницу Dataset того набора данных, которым ты хочешь поделиться, открой выпадающий список действий с набором данных и щелкни по опции Share. Это действие вызовет диалог Share Dataset.
Наконечник
Ты также можешь поделиться набором данных прямо со страницы Datasets.
Установи общий доступ на "Unlisted" и нажми Save.
Теперь любой, у кого есть прямая ссылка на твой набор данных, сможет просмотреть его.
Наконечник
Ты можешь легко нажать на ссылку набора данных, показанную в диалоге Share Dataset, чтобы скопировать его.
Редактирование / удаление набора данных
Перейди на страницу Dataset того набора данных, который ты хочешь отредактировать, открой выпадающий список действий с набором данных и щелкни по опции Edit. Это действие вызовет диалог обновления набора данных.
Примени нужные модификации к своему набору данных, а затем подтверди изменения, нажав кнопку Save.
Перейди на страницу Dataset того набора данных, который ты хочешь удалить, открой выпадающий список действий с набором данных и щелкни по опции Delete. Это действие приведет к удалению набора данных.
Примечание
Если ты передумаешь, то сможешь восстановить набор данных со страницы " Корзина".
Создано 2023-11-12, Обновлено 2024-02-13
Авторы: glenn-jocher (4), priytosh-tripathi (1), RizwanMunawar (1), sergiuwaxmann (1), Laughing-q (1)