Chuyển đến nội dung

Bộ dữ liệu Ultralytics HUB

Các bộ dữ liệu Ultralytics HUB là một giải pháp thiết thực để quản lý và tận dụng các bộ dữ liệu tùy chỉnh của bạn.

Sau khi tải lên, bạn có thể sử dụng ngay lập tức các bộ dữ liệu để huấn luyện mô hình. Cách tiếp cận tích hợp này tạo điều kiện chuyển đổi liền mạch từ quản lý bộ dữ liệu sang huấn luyện mô hình, đơn giản hóa đáng kể toàn bộ quy trình.


Xem: Tải Bộ dữ liệu lên Ultralytics HUB | Hướng dẫn đầy đủ về Tính năng Tải lên Bộ dữ liệu

Tải lên Bộ dữ liệu

Các bộ dữ liệu Ultralytics HUB giống như các bộ dữ liệu YOLOv5 và YOLOv8 🚀. Chúng sử dụng cùng một cấu trúc và cùng một định dạng nhãn để giữ cho mọi thứ đơn giản.

Trước khi bạn tải bộ dữ liệu lên Ultralytics HUB, hãy đảm bảo đặt tệp YAML bộ dữ liệu của bạn bên trong thư mục gốc của bộ dữ liệutệp YAML, thư mục và ZIP bộ dữ liệu của bạn có cùng tên, như được hiển thị trong ví dụ bên dưới, sau đó nén thư mục bộ dữ liệu.

Ví dụ: nếu tập dữ liệu của bạn có tên là "coco8", như của chúng tôi COCO8 bộ dữ liệu ví dụ, thì bạn nên có một coco8.yaml bên trong coco8/ thư mục, thư mục này sẽ tạo ra một coco8.zip khi được nén:

zip -r coco8.zip coco8

Bạn có thể tải xuống bộ dữ liệu ví dụ COCO8 của chúng tôi và giải nén nó để xem chính xác cách cấu trúc bộ dữ liệu của bạn.

Cấu trúc bộ dữ liệu COCO8

YAML bộ dữ liệu là cùng một định dạng YAML tiêu chuẩn YOLOv5 và YOLOv8.

coco8.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8 ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8.zip

Sau khi nén bộ dữ liệu của bạn, bạn nên xác thực nó trước khi tải nó lên Ultralytics HUB. Ultralytics HUB tiến hành kiểm tra xác thực bộ dữ liệu sau khi tải lên, vì vậy bằng cách đảm bảo bộ dữ liệu của bạn được định dạng chính xác và không có lỗi trước thời hạn, bạn có thể ngăn chặn mọi trở ngại do bộ dữ liệu bị từ chối.

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Sau khi ZIP bộ dữ liệu của bạn đã sẵn sàng, hãy điều hướng đến trang Bộ dữ liệu bằng cách nhấp vào nút Bộ dữ liệu trong thanh bên và nhấp vào nút Tải lên Bộ dữ liệu ở phía trên bên phải của trang.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào nút Bộ dữ liệu trong thanh bên và một mũi tên chỉ vào nút Tải lên Bộ dữ liệu

Mẹo

Bạn có thể tải lên bộ dữ liệu trực tiếp từ trang Trang chủ.

Ảnh chụp màn hình Ultralytics HUB của trang Home (Trang chủ) với một mũi tên chỉ vào thẻ Upload Dataset (Tải lên Bộ dữ liệu)

Hành động này sẽ kích hoạt hộp thoại Tải lên bộ dữ liệu.

Chọn tác vụ tập dữ liệu của bạn và tải nó lên trong trường Tệp .zip tập dữ liệu.

Bạn có thêm tùy chọn để đặt tên và mô tả tùy chỉnh cho bộ dữ liệu Ultralytics HUB của mình.

Khi bạn hài lòng với cấu hình bộ dữ liệu của mình, hãy nhấp vào Tải lên.

Ảnh chụp màn hình Ultralytics HUB của hộp thoại Upload Dataset (Tải lên bộ dữ liệu) với các mũi tên chỉ vào dataset task (tác vụ bộ dữ liệu), dataset file (tệp bộ dữ liệu) và nút Upload (Tải lên)

Sau khi bộ dữ liệu của bạn được tải lên và xử lý, bạn sẽ có thể truy cập nó từ trang Bộ dữ liệu.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào một trong các bộ dữ liệu

Bạn có thể xem hình ảnh trong bộ dữ liệu của mình được nhóm theo các phân chia (Train, Validation, Test).

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tab Hình ảnh

Mẹo

Có thể phóng to từng ảnh để xem rõ hơn.

Ảnh chụp màn hình Ultralytics HUB của tab Images (Hình ảnh) bên trong trang Dataset (Bộ dữ liệu) với một mũi tên chỉ vào biểu tượng mở rộng

Ảnh chụp màn hình Ultralytics HUB của tab Images (Hình ảnh) bên trong trang Dataset (Bộ dữ liệu) với một trong các hình ảnh được mở rộng

Ngoài ra, bạn có thể phân tích bộ dữ liệu của mình bằng cách nhấp vào tab Tổng quan.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tab Tổng quan

Tiếp theo, huấn luyện một mô hình trên bộ dữ liệu của bạn.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào nút Huấn luyện Mô hình

Tải xuống bộ dữ liệu

Điều hướng đến trang Dataset của dataset bạn muốn tải xuống, mở danh sách thả xuống các hành động của dataset và nhấp vào tùy chọn Download. Thao tác này sẽ bắt đầu tải xuống dataset của bạn.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Tải xuống

Mẹo

Bạn có thể tải xuống bộ dữ liệu trực tiếp từ trang Datasets.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Tải xuống của một trong các bộ dữ liệu

Chia sẻ bộ dữ liệu

Thông tin

Chức năng chia sẻ của Ultralytics HUB cung cấp một cách thuận tiện để chia sẻ bộ dữ liệu với người khác. Tính năng này được thiết kế để phục vụ cả người dùng Ultralytics HUB hiện tại và những người chưa tạo tài khoản.

Lưu ý

Bạn có quyền kiểm soát quyền truy cập chung vào bộ dữ liệu của mình.

Bạn có thể chọn đặt quyền truy cập chung thành "Private", trong trường hợp đó, chỉ bạn mới có quyền truy cập. Ngoài ra, bạn có thể đặt quyền truy cập chung thành "Unlisted", cho phép bất kỳ ai có liên kết trực tiếp đến bộ dữ liệu đều có thể xem, bất kể họ có tài khoản Ultralytics HUB hay không.

Điều hướng đến trang Dataset của dataset bạn muốn chia sẻ, mở danh sách thả xuống các hành động của dataset và nhấp vào tùy chọn Share. Thao tác này sẽ kích hoạt hộp thoại Share Dataset.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Chia sẻ

Mẹo

Bạn có thể chia sẻ bộ dữ liệu trực tiếp từ trang Datasets.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Chia sẻ của một trong các bộ dữ liệu

Đặt quyền truy cập chung thành "Không công khai" và nhấp vào Lưu.

Ảnh chụp màn hình Ultralytics HUB hộp thoại Chia sẻ Bộ dữ liệu, với mũi tên chỉ vào menu thả xuống và một mũi tên chỉ vào nút Lưu

Giờ đây, bất kỳ ai có liên kết trực tiếp đến bộ dữ liệu của bạn đều có thể xem nó.

Mẹo

Bạn có thể dễ dàng nhấp vào liên kết của bộ dữ liệu hiển thị trong hộp thoại Chia sẻ bộ dữ liệu để sao chép nó.

Ảnh chụp màn hình Ultralytics HUB hộp thoại Chia sẻ Bộ dữ liệu, với mũi tên chỉ vào liên kết của bộ dữ liệu

Chỉnh sửa Tập dữ liệu

Điều hướng đến trang Dataset của dataset bạn muốn chỉnh sửa, mở danh sách thả xuống các hành động của dataset và nhấp vào tùy chọn Edit. Thao tác này sẽ kích hoạt hộp thoại Update Dataset.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Chỉnh sửa

Mẹo

Bạn có thể chỉnh sửa bộ dữ liệu trực tiếp từ trang Datasets.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Chỉnh sửa của một trong các bộ dữ liệu

Áp dụng các sửa đổi mong muốn cho bộ dữ liệu của bạn, sau đó xác nhận các thay đổi bằng cách nhấp vào Lưu.

Ảnh chụp màn hình Ultralytics HUB của hộp thoại Update Dataset (Cập nhật bộ dữ liệu) với một mũi tên chỉ vào nút Save (Lưu)

Xóa bộ dữ liệu

Điều hướng đến trang Dataset của dataset bạn muốn xóa, mở danh sách thả xuống các hành động của dataset và nhấp vào tùy chọn Delete. Thao tác này sẽ xóa dataset.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Xóa

Mẹo

Bạn có thể xóa bộ dữ liệu trực tiếp từ trang Datasets.

Ảnh chụp màn hình Ultralytics HUB của trang Bộ dữ liệu với mũi tên chỉ vào tùy chọn Xóa của một trong các bộ dữ liệu

Lưu ý

Nếu bạn thay đổi ý định, bạn có thể khôi phục bộ dữ liệu từ trang Thùng rác.

Ảnh chụp màn hình Ultralytics HUB của trang Trash (Thùng rác) với một mũi tên chỉ vào nút Trash (Thùng rác) ở thanh bên và một mũi tên chỉ vào tùy chọn Restore (Khôi phục) của một trong các bộ dữ liệu



📅 Đã tạo 1 năm trước ✏️ Cập nhật 5 tháng trước

Bình luận