跳转至内容

Ultralytics HUB 数据集

Ultralytics HUB 数据集是管理和利用自定义数据集的实用解决方案。

上传后,数据集可以立即用于模型训练。这种集成方法有助于从数据集管理到模型训练的无缝过渡,从而大大简化了整个过程。


观看: 上传数据集到 Ultralytics HUB | 数据集上传功能完整演练

上传数据集

Ultralytics HUB 数据集与 YOLOv5 和 YOLOv8 🚀 数据集类似。它们使用相同的结构和标签格式,以保持一切简单。

在将数据集上传到 Ultralytics HUB 之前,请务必将数据集 YAML 文件放在数据集根目录中,并且您的数据集 YAML 文件、目录和 ZIP 文件具有相同的名称,如下例所示,然后将数据集目录压缩。

例如,如果您的数据集名为“coco8”,就像我们的 COCO8 示例数据集,那么您应该有一个 coco8.yaml 在你的...里面 coco8/ 目录,这将创建一个 coco8.zip 压缩后:

zip -r coco8.zip coco8

您可以下载我们的 COCO8 示例数据集并解压缩它,以了解如何构建数据集。

COCO8 数据集结构

该数据集 YAML 文件与标准 YOLOv5 和 YOLOv8 YAML 格式相同。

coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

在压缩数据集后,您应该在将其上传到 Ultralytics HUB 之前验证它Ultralytics HUB 会在上传后进行数据集验证检查,因此通过提前确保您的数据集格式正确且没有错误,您可以避免因数据集被拒绝而造成的任何挫折。

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

准备好数据集 ZIP 文件后,通过单击侧边栏中的 Datasets 按钮导航到Datasets页面,然后单击页面右上角的Upload Dataset按钮。

Ultralytics HUB 截图,显示数据集页面,箭头指向侧边栏中的“数据集”按钮和一个指向“上传数据集”按钮

提示

您可以直接从主页上传数据集。

Ultralytics HUB 截图,显示主页,箭头指向“上传数据集”卡片

此操作将触发上传数据集对话框。

选择您数据集的数据集任务,并将其上传到 数据集 .zip 文件 字段中。

您可以选择为您的 Ultralytics HUB 数据集设置自定义名称和描述。

当您对数据集配置感到满意时,请点击 上传

Ultralytics HUB 上传数据集对话框的屏幕截图,箭头指向数据集任务、数据集文件和“上传”按钮

您的数据集上传并处理后,您将能够从Datasets页面访问它。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集

您可以按分割(训练、验证、测试)查看数据集中的图像。

Ultralytics HUB 截图,显示数据集页面,箭头指向“图像”选项卡

提示

每张图片都可以放大以获得更好的可视化效果。

Ultralytics HUB 截图,显示数据集页面中的“图像”选项卡,箭头指向展开图标

Ultralytics HUB 截图,显示数据集页面中的“图像”选项卡,其中一个图像已展开

此外,您可以通过单击概览选项卡来分析您的数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向“概览”选项卡

接下来,在您的数据集上训练模型

Ultralytics HUB 截图,显示数据集页面,箭头指向“训练模型”按钮

下载数据集

导航至您想要下载的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 下载 选项。此操作将开始下载您的数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向“下载”选项

提示

您可以直接从数据集页面下载数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的“下载”选项

分享数据集

信息

Ultralytics HUB 的共享功能提供了一种与他人共享数据集的便捷方式。此功能旨在同时方便现有的 Ultralytics HUB 用户和尚未创建帐户的用户。

注意

您可以控制数据集的常规访问权限。

您可以选择将常规访问权限设置为“私有”,在这种情况下,只有您才能访问它。或者,您可以将常规访问权限设置为“未公开”,这将授予任何拥有数据集直接链接的人员查看权限,无论他们是否拥有 Ultralytics HUB 帐户。

导航至您想要共享的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 共享 选项。此操作将触发 共享数据集 对话框。

Ultralytics HUB 截图,显示数据集页面,箭头指向“分享”选项

提示

您可以直接从数据集页面共享数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的“分享”选项

将常规访问权限设置为“不公开列出”,然后点击保存

Ultralytics HUB 截图中,“Share Dataset”对话框,箭头指向下拉菜单和一个“Save”按钮。

现在,任何拥有您数据集直接链接的人都可以查看它。

提示

您可以轻松点击共享数据集对话框中显示的数据集链接来复制它。

Ultralytics HUB 截图中,“Share Dataset”对话框,箭头指向数据集的链接。

编辑数据集

导航至您想要编辑的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 编辑 选项。此操作将触发 更新数据集 对话框。

Ultralytics HUB 截图,显示数据集页面,箭头指向“编辑”选项

提示

您可以直接从数据集页面编辑数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的“编辑”选项

对数据集应用所需的修改,然后单击 保存 以确认更改。

Ultralytics HUB 更新数据集对话框的屏幕截图,箭头指向“保存”按钮

删除数据集

导航至您想要删除的数据集的数据集页面,打开数据集操作下拉菜单,然后点击 删除 选项。此操作将删除数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向“删除”选项

提示

您可以直接从数据集页面删除数据集。

Ultralytics HUB 截图,显示数据集页面,箭头指向其中一个数据集的“删除”选项

注意

如果您改变主意,您可以从回收站页面恢复数据集。

Ultralytics HUB “回收站”页面的屏幕截图,箭头指向侧边栏中的“回收站”按钮和一个指向其中一个数据集的“恢复”选项



📅 创建于 1 年前 ✏️ 更新于 5 个月前

评论