Ultralytics HUB 数据集
Ultralytics HUB数据集是管理和利用自定义数据集的实用解决方案。
数据集上传后,可立即用于模型训练。这种集成方法实现了从数据集管理到模型训练的无缝过渡,大大简化了整个流程。
观看: 观看:将数据集上传至Ultralytics HUB | 数据集上传功能完整演示
上传数据集
Ultralytics HUB数据集与YOLOv5 和YOLOv8 🚀 数据集一样。它们使用相同的结构和标签格式,以保持一切简单。
在将数据集上传到Ultralytics HUB 之前,请确保 将数据集 YAML 文件放在数据集根目录内,并确保数据集YAML、目录和 ZIP 具有相同的名称(如下图所示),然后将数据集目录压缩。
例如,如果您的数据集名为 "coco8",就像我们的 COCO8 示例数据集,那么您应该有一个 coco8.yaml
你的 coco8/
目录,该目录将创建一个 coco8.zip
当拉链拉上时
您可以下载我们的COCO8示例数据集并解压缩,以了解如何构建您的数据集。
数据集 YAML 与YOLOv5 和YOLOv8 YAML 格式相同。
coco8.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
压缩数据集后,您应在将其上传到Ultralytics HUB 之前 对其进行验证。Ultralytics HUB会在数据集上传后进行数据集验证检查,因此,提前确保数据集格式正确无误,就能避免因数据集被拒而造成的任何损失。
数据集 ZIP 准备就绪后,点击侧边栏中的数据集按钮导航至数据集页面,然后点击页面右上方的上传数据集按钮。
提示
您可以直接从主页上传数据集。
此操作将触发上传数据集对话框。
选择数据集的数据集任务,并将其上传至数据集 .zip 文件字段。
您还可以为Ultralytics HUB 数据集设置自定义名称和描述。
对数据集配置满意后,单击上传。
数据集上传并处理完毕后,您就可以从数据集页面进行访问。
您可以查看数据集中按拆分(训练、验证、测试)分组的图像。
提示
每张图片都可以放大,以便更直观地显示。
此外,您还可以点击 "概览"选项卡分析数据集。
接下来,在数据集上训练一个模型。
下载数据集
导航到要下载的数据集的数据集页面,打开数据集操作下拉菜单,点击下载选项。该操作将开始下载数据集。
提示
您可以直接从数据集页面下载数据集。
共享数据集
信息
Ultralytics HUB 的共享功能提供了一种与他人共享数据集的便捷方式。该功能既适用于Ultralytics HUB 现有用户,也适用于尚未创建账户的用户。
备注
您可以控制数据集的一般访问权限。
您可以选择将一般访问权限设置为 "私人",在这种情况下,只有您才能访问该数据集。或者,您也可以将一般访问权限设置为 "非列表",这样,任何拥有数据集直接链接的人,无论是否拥有Ultralytics HUB 账户,都可以查看数据集。
导航到要共享的数据集的数据集页面,打开数据集操作下拉菜单并单击共享选项。此操作将触发共享数据集对话框。
提示
您可以直接从数据集页面共享数据集。
将一般访问权限设置为 "非列表",然后单击保存。
现在,任何拥有您数据集直接链接的人都可以查看它。
提示
您可以轻松点击共享数据集对话框中显示的数据集链接来复制数据集。
编辑数据集
导航到要编辑的数据集的数据集页面,打开数据集操作下拉菜单并单击编辑选项。此操作将触发更新数据集对话框。
提示
您可以直接从数据集页面编辑数据集。
对数据集进行所需的修改,然后单击 "保存"确认更改。
删除数据集
导航到要删除的数据集的数据集页面,打开数据集操作下拉菜单,点击删除选项。该操作将删除数据集。
提示
您可以直接从数据集页面删除数据集。
备注
如果改变主意,可以从回收站页面恢复数据集。