Ultralytics HUB 数据集
Ultralytics HUB 数据集是管理和利用自定义数据集的实用解决方案。
上传后,数据集可以立即用于模型训练。这种集成方法有助于从数据集管理到模型训练的无缝过渡,从而大大简化了整个过程。
观看: 上传数据集到 Ultralytics HUB | 数据集上传功能完整演练
上传数据集
Ultralytics HUB 数据集与 YOLOv5 和 YOLOv8 🚀 数据集类似。它们使用相同的结构和标签格式,以保持一切简单。
在将数据集上传到 Ultralytics HUB 之前,请务必将数据集 YAML 文件放在数据集根目录中,并且您的数据集 YAML 文件、目录和 ZIP 文件具有相同的名称,如下例所示,然后将数据集目录压缩。
例如,如果您的数据集名为“coco8”,就像我们的 COCO8 示例数据集,那么您应该有一个 coco8.yaml 在你的...里面 coco8/ 目录,这将创建一个 coco8.zip 压缩后:
zip -r coco8.zip coco8
您可以下载我们的 COCO8 示例数据集并解压缩它,以了解如何构建数据集。
该数据集 YAML 文件与标准 YOLOv5 和 YOLOv8 YAML 格式相同。
coco8.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8 ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip
在压缩数据集后,您应该在将其上传到 Ultralytics HUB 之前验证它。Ultralytics HUB 会在上传后进行数据集验证检查,因此通过提前确保您的数据集格式正确且没有错误,您可以避免因数据集被拒绝而造成的任何挫折。
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
准备好数据集 ZIP 文件后,通过单击侧边栏中的 Datasets 按钮导航到Datasets页面,然后单击页面右上角的Upload Dataset按钮。

此操作将触发上传数据集对话框。
选择您数据集的数据集任务,并将其上传到 数据集 .zip 文件 字段中。
您可以选择为您的 Ultralytics HUB 数据集设置自定义名称和描述。
当您对数据集配置感到满意时,请点击 上传。

您的数据集上传并处理后,您将能够从Datasets页面访问它。

您可以按分割(训练、验证、测试)查看数据集中的图像。

提示
每张图片都可以放大以获得更好的可视化效果。
![]()

此外,您可以通过单击概览选项卡来分析您的数据集。

接下来,在您的数据集上训练模型。

下载数据集
导航至您想要下载的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 下载 选项。此操作将开始下载您的数据集。

分享数据集
信息
Ultralytics HUB 的共享功能提供了一种与他人共享数据集的便捷方式。此功能旨在同时方便现有的 Ultralytics HUB 用户和尚未创建帐户的用户。
注意
您可以控制数据集的常规访问权限。
您可以选择将常规访问权限设置为“私有”,在这种情况下,只有您才能访问它。或者,您可以将常规访问权限设置为“未公开”,这将授予任何拥有数据集直接链接的人员查看权限,无论他们是否拥有 Ultralytics HUB 帐户。
导航至您想要共享的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 共享 选项。此操作将触发 共享数据集 对话框。

将常规访问权限设置为“不公开列出”,然后点击保存。

现在,任何拥有您数据集直接链接的人都可以查看它。
提示
您可以轻松点击共享数据集对话框中显示的数据集链接来复制它。

编辑数据集
导航至您想要编辑的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 编辑 选项。此操作将触发 更新数据集 对话框。

对数据集应用所需的修改,然后单击 保存 以确认更改。

删除数据集
导航至您想要删除的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 删除 选项。此操作将删除数据集。






