跳至内容

Ultralytics HUB 数据集

Ultralytics HUB数据集是管理和利用自定义数据集的实用解决方案。

数据集上传后,可立即用于模型训练。这种集成方法实现了从数据集管理到模型训练的无缝过渡,大大简化了整个流程。


观看: Upload Datasets to Ultralytics HUB | Complete Walkthrough of Dataset Upload Feature

上传数据集

Ultralytics HUB数据集与YOLOv5 和YOLOv8 🚀 数据集一样。它们使用相同的结构和标签格式,以保持一切简单。

在将数据集上传到Ultralytics HUB 之前,请确保 将数据集 YAML 文件放在数据集根目录内,并确保数据集 YAML、目录和 ZIP 具有相同的名称(如下图所示),然后将数据集目录压缩。

例如,如果您的数据集名为 "coco8",就像我们的 COCO8 示例数据集,那么您应该有一个 coco8.yaml 你的 coco8/ 目录,创建一个 coco8.zip 当拉链拉上时

zip -r coco8.zip coco8

您可以下载我们的COCO8示例数据集并解压缩,以了解如何构建您的数据集。

COCO8 数据集结构

数据集 YAML 与YOLOv5 和YOLOv8 YAML 格式相同。

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

压缩数据集后,您应在将其上传到Ultralytics HUB 之前 对其进行验证Ultralytics HUB会在数据集上传后进行数据集验证检查,因此,提前确保数据集格式正确无误,就能避免因数据集被拒而造成的任何损失。

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

数据集 ZIP 准备就绪后,点击侧边栏中的数据集按钮导航至数据集页面,然后点击页面右上方的上传数据集按钮。

Ultralytics 数据集页面的 HUB 截图,其中一个箭头指向侧边栏的数据集按钮,另一个箭头指向上传数据集按钮

提示

您可以直接从主页上传数据集。

Ultralytics HUB 主页截图,箭头指向上传数据集卡

此操作将触发上传数据集对话框。

选择数据集的数据集任务,并将其上传至数据集 .zip 文件字段。

您还可以为Ultralytics HUB 数据集设置自定义名称和描述。

对数据集配置满意后,单击上传

Ultralytics 上传数据集对话框的 HUB 截图,箭头指向数据集任务、数据集文件和上传按钮

数据集上传并处理完毕后,您就可以从数据集页面进行访问。

Ultralytics 数据集页面的 HUB 截图,箭头指向其中一个数据集

您可以查看数据集中按拆分(训练、验证、测试)分组的图像。

Ultralytics 数据集页面的 HUB 截图,箭头指向图像选项卡

提示

每张图片都可以放大,以便更直观地显示。

Ultralytics 数据集页面内图像选项卡的 HUB 截图,箭头指向展开图标

Ultralytics 数据集页面内图像选项卡的 HUB 截图,其中一幅图像已展开

此外,您还可以点击 "概览"选项卡分析数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向 "概览 "选项卡

接下来,在数据集上训练一个模型

Ultralytics 数据集页面的 HUB 截图,箭头指向 "训练模型 "按钮

下载数据集

导航到要下载的数据集的数据集页面,打开数据集操作下拉菜单,点击下载选项。该操作将开始下载数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向下载选项

提示

您可以直接从数据集页面下载数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向其中一个数据集的下载选项

共享数据集

信息

Ultralytics HUB 的共享功能提供了一种与他人共享数据集的便捷方式。该功能既适用于Ultralytics HUB 现有用户,也适用于尚未创建账户的用户。

备注

您可以控制数据集的一般访问权限。

您可以选择将一般访问权限设置为 "私人",在这种情况下,只有您才能访问该数据集。或者,您也可以将一般访问权限设置为 "非列表",这样,任何拥有数据集直接链接的人,无论是否拥有Ultralytics HUB 账户,都可以查看数据集。

导航到要共享的数据集的数据集页面,打开数据集操作下拉菜单并单击共享选项。此操作将触发共享数据集对话框。

Ultralytics 数据集页面的 HUB 截图,箭头指向 "共享 "选项

提示

您可以直接从数据集页面共享数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向其中一个数据集的共享选项

将一般访问权限设置为 "非列表",然后单击保存

Ultralytics 共享数据集对话框的 HUB 截图,箭头指向下拉菜单,箭头指向保存按钮

现在,任何拥有您数据集直接链接的人都可以查看它。

提示

您可以轻松点击共享数据集对话框中显示的数据集链接来复制数据集。

Ultralytics 共享数据集对话框的 HUB 截图,箭头指向数据集链接

编辑数据集

导航到要编辑的数据集的数据集页面,打开数据集操作下拉菜单并单击编辑选项。此操作将触发更新数据集对话框。

Ultralytics 数据集页面的 HUB 截图,箭头指向编辑选项

提示

您可以直接从数据集页面编辑数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向其中一个数据集的编辑选项

对数据集进行所需的修改,然后单击 "保存 "确认更改。

Ultralytics 更新数据集对话框的 HUB 截图,箭头指向保存按钮

删除数据集

导航到要删除的数据集的数据集页面,打开数据集操作下拉菜单,点击删除选项。该操作将删除数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向删除选项

提示

您可以直接从数据集页面删除数据集。

Ultralytics 数据集页面的 HUB 截图,箭头指向其中一个数据集的删除选项

备注

如果改变主意,可以从回收站页面恢复数据集。

Ultralytics HUB 垃圾箱页面截图,箭头指向侧边栏中的 "垃圾桶 "按钮,箭头指向其中一个数据集的 "还原 "选项

📅创建于 1 年前 ✏️已更新 0 天前

评论