Ultralytics HUB 数据集
Ultralytics HUB 数据集是管理和利用自定义数据集的实用解决方案。
上传后,数据集可以立即用于模型训练。这种集成方法有助于从数据集管理到模型训练的无缝过渡,从而大大简化了整个过程。
观看: 上传数据集到 Ultralytics HUB | 数据集上传功能完整演练
上传数据集
Ultralytics HUB 数据集与 YOLOv5 和 YOLOv8 🚀 数据集类似。它们使用相同的结构和标签格式,以保持一切简单。
在将数据集上传到 Ultralytics HUB 之前,请务必将数据集 YAML 文件放在数据集根目录中,并且您的数据集 YAML 文件、目录和 ZIP 文件具有相同的名称,如下例所示,然后将数据集目录压缩。
例如,如果您的数据集名为“coco8”,就像我们的 COCO8 示例数据集,那么您应该有一个 coco8.yaml
在你的...里面 coco8/
目录,这将创建一个 coco8.zip
压缩后:
zip -r coco8.zip coco8
您可以下载我们的 COCO8 示例数据集并解压缩它,以了解如何构建数据集。
该数据集 YAML 文件与标准 YOLOv5 和 YOLOv8 YAML 格式相同。
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
在压缩数据集后,您应该在将其上传到 Ultralytics HUB 之前验证它。Ultralytics HUB 会在上传后进行数据集验证检查,因此通过提前确保您的数据集格式正确且没有错误,您可以避免因数据集被拒绝而造成的任何挫折。
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
准备好数据集 ZIP 文件后,通过单击侧边栏中的 Datasets 按钮导航到Datasets页面,然后单击页面右上角的Upload Dataset按钮。
此操作将触发上传数据集对话框。
选择您数据集的数据集任务,并将其上传到 数据集 .zip 文件 字段中。
您可以选择为您的 Ultralytics HUB 数据集设置自定义名称和描述。
当您对数据集配置感到满意时,请点击 上传。
您的数据集上传并处理后,您将能够从Datasets页面访问它。
您可以按分割(训练、验证、测试)查看数据集中的图像。
提示
每张图片都可以放大以获得更好的可视化效果。
此外,您可以通过单击概览选项卡来分析您的数据集。
接下来,在您的数据集上训练模型。
下载数据集
导航至您想要下载的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 下载 选项。此操作将开始下载您的数据集。
分享数据集
信息
Ultralytics HUB 的共享功能提供了一种与他人共享数据集的便捷方式。此功能旨在同时方便现有的 Ultralytics HUB 用户和尚未创建帐户的用户。
注意
您可以控制数据集的常规访问权限。
您可以选择将常规访问权限设置为“私有”,在这种情况下,只有您才能访问它。或者,您可以将常规访问权限设置为“未公开”,这将授予任何拥有数据集直接链接的人员查看权限,无论他们是否拥有 Ultralytics HUB 帐户。
导航至您想要共享的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 共享 选项。此操作将触发 共享数据集 对话框。
将常规访问权限设置为“不公开列出”,然后点击保存。
现在,任何拥有您数据集直接链接的人都可以查看它。
提示
您可以轻松点击共享数据集对话框中显示的数据集链接来复制它。
编辑数据集
导航至您想要编辑的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 编辑 选项。此操作将触发 更新数据集 对话框。
对数据集应用所需的修改,然后单击 保存 以确认更改。
删除数据集
导航至您想要删除的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 删除 选项。此操作将删除数据集。