Наборы данных Ultralytics HUB
Наборы данных Ultralytics HUB — это практичное решение для управления вашими пользовательскими наборами данных и их использования.
После загрузки наборы данных можно сразу использовать для обучения моделей. Этот интегрированный подход упрощает переход от управления набором данных к обучению модели, что значительно упрощает весь процесс.
Смотреть: Загрузка наборов данных в Ultralytics HUB | Полное руководство по функции загрузки наборов данных
Загрузить набор данных
Наборы данных Ultralytics HUB похожи на наборы данных YOLOv5 и YOLOv8 🚀. Они используют ту же структуру и те же форматы меток, чтобы все было просто.
Прежде чем загружать набор данных в Ultralytics HUB, убедитесь, что вы поместили YAML-файл набора данных в корневой каталог набора данных и что ваш YAML-файл набора данных, каталог и ZIP-архив имеют одинаковое имя, как показано в примере ниже, а затем заархивируйте каталог набора данных.
Например, если ваш набор данных называется "coco8", как в нашем случае, COCO8 пример набора данных, тогда у вас должен быть coco8.yaml
внутри вашего coco8/
каталог, который создаст coco8.zip
в заархивированном виде:
zip -r coco8.zip coco8
Вы можете скачать наш пример набора данных COCO8 и распаковать его, чтобы увидеть, как именно структурировать свой набор данных.
YAML-файл набора данных соответствует стандартному формату YAML для YOLOv5 и YOLOv8.
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
После архивирования вашего набора данных, вам следует проверить его перед загрузкой в Ultralytics HUB. Ultralytics HUB выполняет проверку набора данных после загрузки, поэтому, заранее убедившись, что ваш набор данных правильно отформатирован и не содержит ошибок, вы можете предотвратить любые неудачи, связанные с отклонением набора данных.
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Как только ваш ZIP-архив с набором данных будет готов, перейдите на страницу Datasets, нажав на кнопку Datasets на боковой панели, и нажмите кнопку Upload Dataset в правом верхнем углу страницы.
Это действие вызовет диалоговое окно Upload Dataset.
Выберите задачу набора данных для вашего набора данных и загрузите его в поле Dataset .zip file.
У вас есть дополнительная возможность установить пользовательское имя и описание для вашего набора данных Ultralytics HUB.
Когда вы будете довольны конфигурацией набора данных, нажмите Upload.
После загрузки и обработки вашего набора данных вы сможете получить к нему доступ со страницы Datasets.
Вы можете просматривать изображения в вашем наборе данных, сгруппированные по разделам (Train, Validation, Test).
Совет
Каждое изображение можно увеличить для лучшей визуализации.
Кроме того, вы можете проанализировать свой набор данных, щелкнув вкладку Обзор.
Далее, обучите модель на своем наборе данных.
Скачать набор данных
Перейдите на страницу набора данных, который вы хотите скачать, откройте выпадающее меню действий с набором данных и выберите пункт Скачать. Это действие запустит скачивание вашего набора данных.
Поделиться набором данных
Информация
Функция обмена данными Ultralytics HUB предоставляет удобный способ обмена наборами данных с другими пользователями. Эта функция предназначена как для существующих пользователей Ultralytics HUB, так и для тех, кто еще не создал учетную запись.
Примечание
Вы контролируете общий доступ к своим наборам данных.
Вы можете установить общий доступ как «Private», и в этом случае доступ к нему будете иметь только вы. В качестве альтернативы, вы можете установить общий доступ как «Unlisted», что предоставит доступ к просмотру любому, у кого есть прямая ссылка на набор данных, независимо от того, есть ли у них учетная запись Ultralytics HUB или нет.
Перейдите на страницу набора данных, которым вы хотите поделиться, откройте выпадающее меню действий с набором данных и выберите пункт Поделиться. Это действие откроет диалоговое окно Поделиться набором данных.
Установите общий доступ на «Unlisted» и нажмите Save.
Теперь любой, у кого есть прямая ссылка на ваш набор данных, может просмотреть его.
Совет
Вы можете легко скопировать ссылку на набор данных, нажав на нее в диалоговом окне Share Dataset.
Редактировать набор данных
Перейдите на страницу набора данных, который вы хотите изменить, откройте выпадающее меню действий с набором данных и выберите пункт Редактировать. Это действие откроет диалоговое окно Обновление набора данных.
Внесите желаемые изменения в свой набор данных, а затем подтвердите изменения, нажав Сохранить.
Удалить набор данных
Перейдите на страницу набора данных, который вы хотите удалить, откройте выпадающее меню действий с набором данных и выберите пункт Удалить. Это действие приведет к удалению набора данных.