Bộ dữ liệu

Q: How does storage work?

Nền tảng Ultralytics sử dụng Lưu trữ theo địa chỉ nội dung (CAS) để lưu trữ hiệu quả:

Ultralytics Platform cung cấp một giải pháp tối ưu để quản lý dữ liệu huấn luyện của bạn. Sau khi tải lên, các tập dữ liệu có thể được sử dụng ngay lập tức để huấn luyện mô hình, với khả năng xử lý tự động và tạo thống kê.

Tải lên Bộ dữ liệu

Ultralytics Nền tảng hỗ trợ nhiều định dạng tải lên khác nhau để tăng tính linh hoạt.

Các định dạng được hỗ trợ

ẢnhVideoLưu trữ

Định dạng	Phần mở rộng	Ghi chú	Kích thước tối đa
JPEG	`.jpg`, `.jpeg`	Phổ biến nhất, được khuyến nghị	50 MB
PNG	`.png`	Ủng hộ tính minh bạch	50 MB
WebP	`.webp`	Hiện đại, khả năng nén tốt	50 MB
BMP	`.bmp`	Chưa nén	50 MB
TIFF	`.tiff`, `.tif`	Chất lượng cao	50 MB
HEIC	`.heic`	Ảnh chụp bằng iPhone	50 MB
AVIF	`.avif`	Định dạng thế hệ tiếp theo	50 MB
JP2	`.jp2`	JPEG 2000	50 MB
DNG	`.dng`	Máy ảnh RAW	50 MB
MPO	`.mpo`	Đối tượng nhiều hình ảnh	50 MB

Video được tự động trích xuất thành từng khung hình ở phía máy khách với tốc độ 1 khung hình/giây (tối đa 100 khung hình mỗi video).

Định dạng	Phần mở rộng	Chiết xuất	Kích thước tối đa
MP4	`.mp4`	1 FPS, tối đa 100 khung hình/giây	1 GB
WebM	`.webm`	1 FPS, tối đa 100 khung hình/giây	1 GB
MOV	`.mov`	1 FPS, tối đa 100 khung hình/giây	1 GB
AVI	`.avi`	1 FPS, tối đa 100 khung hình/giây	1 GB
MKV	`.mkv`	1 FPS, tối đa 100 khung hình/giây	1 GB
M4V	`.m4v`	1 FPS, tối đa 100 khung hình/giây	1 GB

Trích xuất khung hình video

Các khung hình video được trích xuất với tốc độ 1 khung hình/giây trong trình duyệt trước khi tải lên. Một video dài 60 giây sẽ tạo ra 60 khung hình. Số khung hình tối đa cho mỗi video là 100, vì vậy các video dài hơn khoảng 100 giây sẽ được lấy mẫu.

Các tệp lưu trữ được trích xuất và xử lý tự động.

Định dạng	Phần mở rộng	Ghi chú	Kích thước tối đa
Mã bưu chính	`.zip`	Phổ biến nhất	10 GB
TAR	`.tar`	Tệp lưu trữ chưa nén	10 GB
TAR.GZ	`.tar.gz`, `.tgz`	Tệp lưu trữ nén	10 GB
GZ	`.gz`	Nén bằng Gzip	10 GB

Chuẩn bị Tập dữ liệu của bạn

Nền tảng này hỗ trợ hai định dạng chú thích cộng với tải lên ảnh thô: Ultralytics YOLO , COCO và ảnh thô (chưa được chú thích):

Định dạng YOLOCOCO Định dạng

Sử dụng tiêu chuẩn YOLO cấu trúc thư mục với data.yaml tệp:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Tệp YAML định nghĩa cấu hình tập dữ liệu của bạn:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Sử dụng các tệp chú thích JSON với cấu trúc COCO tiêu chuẩn:

my-coco-dataset/
├── train/
│   ├── _annotations.coco.json
│   ├── img001.jpg
│   └── img002.jpg
└── val/
    ├── _annotations.coco.json
    ├── img003.jpg
    └── img004.jpg

Tệp JSON chứa images, annotations, và categories mảng:

{
    "images": [{ "id": 1, "file_name": "img001.jpg", "width": 640, "height": 480 }],
    "annotations": [{ "id": 1, "image_id": 1, "category_id": 0, "bbox": [100, 50, 200, 300] }],
    "categories": [{ "id": 0, "name": "person" }]
}

COCO Chú thích được tự động chuyển đổi trong quá trình tải lên. Phát hiện (bbox), phân đoạn (segmentation đa giác), và tư thế (keypointsCác tác vụ ) được hỗ trợ. ID danh mục được ánh xạ lại thành một chuỗi dày đặc có chỉ số 0 trên tất cả các tệp chú thích. Để chuyển đổi giữa các định dạng, hãy xem công cụ chuyển đổi định dạng.

Tải lên thô

Ảnh thô : Tải lên hình ảnh chưa được chú thích (không có nhãn). Hữu ích khi bạn dự định chú thích trực tiếp trên nền tảng bằng trình chỉnh sửa chú thích .

Cấu trúc thư mục phẳng

Bạn cũng có thể tải lên hình ảnh mà không cần cấu trúc thư mục train/val. Hình ảnh được tải lên mà không phân tách thư mục sẽ được gán vào... train Mặc định chúng được chia nhỏ. Bạn có thể gán lại chúng sau này bằng tính năng di chuyển hàng loạt đến thư mục chia nhỏ.

Tự động phát hiện định dạng

Định dạng được tự động phát hiện: tập dữ liệu có data.yaml chứa names, train, hoặc val các khóa được coi là YOLO . Các tập dữ liệu với COCO Các tệp JSON (chứa images, annotations, và categories mảng) được coi là COCO Các tập dữ liệu chỉ chứa hình ảnh mà không có chú thích sẽ được coi là dữ liệu thô.

Để biết chi tiết về định dạng cụ thể cho từng tác vụ, hãy xem các tác vụ được hỗ trợ và Tổng quan về tập dữ liệu .

Quy trình tải lên

Điều hướng đến Datasets trong thanh bên
Nhấp chuột New Dataset hoặc kéo tệp vào khu vực tải lên
Chọn loại tác vụ (xem các tác vụ được hỗ trợ )
Thêm tên và mô tả tùy chọn
Thiết lập chế độ hiển thị (công khai hoặc riêng tư) và giấy phép tùy chọn (xem các giấy phép hiện có )
Nhấp chuột Create

Ultralytics Hộp thoại tải lên tập dữ liệu nền tảng Bộ chọn tác vụ

Sau khi tải lên, nền tảng sẽ xử lý dữ liệu của bạn thông qua quy trình nhiều giai đoạn:

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff

Xác thực : Kiểm tra định dạng và kích thước
Chuẩn hóa : Ảnh kích thước lớn được thu nhỏ (tối đa 4096px, tối thiểu 28px)
Ảnh thu nhỏ : Ảnh xem trước WebP 256px được tạo tự động
Phân tích nhãn : YOLO và COCO nhãn định dạng được trích xuất
Thống kê : Phân bố lớp và kích thước ảnh được tính toán.

Ultralytics Thanh tiến độ tải lên bộ dữ liệu nền tảng

Xác thực trước khi tải lên

Bạn có thể xác thực tập dữ liệu của mình cục bộ trước khi tải lên:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Yêu cầu về kích thước hình ảnh

Ảnh phải có kích thước tối thiểu 28px ở cạnh ngắn nhất. Ảnh nhỏ hơn kích thước này sẽ bị loại bỏ trong quá trình xử lý. Ảnh có kích thước lớn hơn 4096px ở cạnh dài nhất sẽ tự động được điều chỉnh kích thước mà vẫn giữ nguyên tỷ lệ khung hình.

Duyệt hình ảnh

Xem hình ảnh tập dữ liệu của bạn trong nhiều bố cục khác nhau:

Xem	Mô tả
Dạng lưới	Lưới hình thu nhỏ với lớp phủ chú thích (mặc định)
Thu gọn	Hình thu nhỏ nhỏ hơn để quét nhanh
Bảng	Danh sách bao gồm hình thu nhỏ, tên tệp, kích thước, dung lượng, phân chia, lớp và số lượng nhãn.

Ultralytics Thư viện bộ dữ liệu nền tảng dạng lưới với chú thích

Sắp xếp và lọc

Bạn có thể sắp xếp và lọc hình ảnh để duyệt nhanh hơn:

Tùy chọn sắp xếpBộ lọc

Sắp xếp	Mô tả
Mới nhất	Mới được thêm gần đây nhất
Cũ nhất	Được thêm sớm nhất
Tên AZ	Theo thứ tự bảng chữ cái
Tên ZA	Thứ tự bảng chữ cái ngược
Kích thước (nhỏ nhất)	Ưu tiên các tập tin nhỏ nhất trước.
Kích thước (lớn nhất)	Các tập tin lớn nhất được ưu tiên trước.
Hầu hết các nhãn	Hầu hết các chú thích
Ít nhãn nhất	Ít chú thích nhất

Bộ lọc	Các tùy chọn
Bộ lọc tách	Huấn luyện, Xác nhận, Kiểm tra, hoặc Tất cả
Bộ lọc nhãn	Tất cả hình ảnh, có chú thích hoặc không có chú thích
Tìm kiếm	Lọc hình ảnh theo tên tệp

Tìm kiếm hình ảnh chưa được gắn nhãn

Sử dụng bộ lọc nhãn được đặt thành Unannotated Để nhanh chóng tìm thấy những hình ảnh vẫn cần chú thích. Điều này đặc biệt hữu ích đối với các tập dữ liệu lớn, nơi bạn muốn track ghi nhãn tiến độ.

Trình xem toàn màn hình

Nhấp vào bất kỳ hình ảnh nào để mở trình xem toàn màn hình với:

Điều hướng : Sử dụng phím mũi tên hoặc xem trước hình thu nhỏ để duyệt.
Siêu dữ liệu : Tên tệp, kích thước, huy hiệu phân chia, số lượng chú thích
Chú thích : Bật/tắt hiển thị lớp phủ chú thích
Phân loại theo lớp : Số lượng nhãn cho mỗi lớp được đánh dấu bằng màu sắc.
Chỉnh sửa : Vào chế độ chú thích để thêm hoặc sửa đổi nhãn.
Tải xuống : Tải xuống tệp hình ảnh gốc
Xóa : Xóa hình ảnh khỏi tập dữ liệu.
Phóng: Cmd/Ctrl+Scroll để phóng to/thu nhỏ
Chế độ xem pixel : Bật/tắt chế độ hiển thị pixel để xem chi tiết hơn.

Ultralytics Trình xem toàn màn hình các tập dữ liệu nền tảng với bảng siêu dữ liệu

Lọc theo phân tách

Lọc hình ảnh theo phân tách tập dữ liệu của chúng:

Phân tách	Mục đích
Huấn luyện	Được sử dụng để huấn luyện mô hình
Val	Được sử dụng để xác thực trong quá trình huấn luyện
Kiểm thử	Được sử dụng để đánh giá cuối cùng

Các tab tập dữ liệu

Mỗi trang dữ liệu có năm tab có thể truy cập từ thanh tab:

Tab Hình ảnh

Chế độ xem mặc định hiển thị thư viện hình ảnh với các lớp phủ chú thích. Hỗ trợ các chế độ xem dạng lưới, thu gọn và bảng. Kéo và thả tệp vào đây để thêm hình ảnh khác.

Tab Lớp học

Quản lý các lớp chú thích cho tập dữ liệu của bạn:

Biểu đồ phân bố theo lớp : Biểu đồ cột hiển thị số lượng chú thích cho mỗi lớp với tùy chọn chuyển đổi thang đo tuyến tính/logarit.
Bảng lớp : Bảng có thể sắp xếp và tìm kiếm, hiển thị tên lớp, số lượng nhãn và số lượng hình ảnh.
Chỉnh sửa tên lớp : Nhấp vào bất kỳ tên lớp nào để đổi tên trực tiếp.
Chỉnh sửa màu sắc lớp học : Nhấp vào ô màu để thay đổi màu sắc của lớp học.
Thêm lớp học mới : Sử dụng ô nhập liệu ở phía dưới để thêm lớp học.

Ultralytics Tab Tập dữ liệu nền tảng, Biểu đồ tần số và Bảng.

Thang đo logarit cho tập dữ liệu không cân bằng

Nếu tập dữ liệu của bạn có sự mất cân bằng lớp (ví dụ: 10.000 chú thích "người" nhưng chỉ có 50 "xe đạp"), hãy sử dụng Log Scale Bật biểu đồ phân bố theo lớp để trực quan hóa tất cả các lớp một cách rõ ràng.

Tab Biểu đồ

Số liệu thống kê tự động được tính toán từ tập dữ liệu của bạn:

Biểu đồ	Mô tả
Phân phối chia nhỏ	Biểu đồ hình tròn thể hiện số lượng ảnh huấn luyện/kiểm định/thử nghiệm và tỷ lệ phần trăm được ghi nhãn.
Các lớp học hàng đầu	Biểu đồ hình bánh vòng thể hiện 10 lớp chú thích thường gặp nhất.
Chiều rộng hình ảnh	Biểu đồ phân bố độ rộng ảnh theo giá trị trung bình.
Chiều cao hình ảnh	Biểu đồ phân bố chiều cao hình ảnh theo giá trị trung bình.
Điểm trên mỗi lần	Số lượng đỉnh đa giác hoặc điểm đặc trưng cho mỗi chú thích ( segment /tư thế)
Vị trí chú thích	Bản đồ nhiệt 2D về vị trí tâm của các hộp giới hạn
Kích thước hình ảnh	Bản đồ nhiệt 2D chiều rộng so với chiều cao kèm theo hướng dẫn tỷ lệ khung hình.

Ultralytics Bảng thống kê dữ liệu nền tảng > Biểu đồ > Lưới thống kê

Bộ nhớ đệm thống kê

Thống kê được lưu vào bộ nhớ đệm trong 5 phút. Các thay đổi đối với chú thích sẽ được phản ánh sau khi bộ nhớ đệm hết hạn.

Bản đồ nhiệt toàn màn hình

Nhấp vào nút mở rộng trên bất kỳ bản đồ nhiệt nào để xem ở chế độ toàn màn hình. Điều này cung cấp chế độ xem lớn hơn, chi tiết hơn — hữu ích để hiểu các mô hình không gian trong các tập dữ liệu lớn.

Tab Mô hình

Xem tất cả các mô hình được huấn luyện trên tập dữ liệu này trong một bảng có thể tìm kiếm:

Cột	Mô tả
Tên	Tên mô hình kèm liên kết
Dự án	Dự án cha có biểu tượng
Trạng thái	Huy hiệu trạng thái đào tạo
Tác vụ	YOLO loại nhiệm vụ
Số epoch	Kỷ nguyên tốt nhất / Tổng số kỷ nguyên
mAP50-95	Độ chính xác trung bình
mAP50	mAP Tại IoU 0,50
Đã tạo	Ngày tạo

Ultralytics Tab Mô hình Tập dữ liệu Nền tảng Bảng Mô hình đã huấn luyện

Tab Lỗi

Các hình ảnh không thể xử lý được liệt kê ở đây kèm theo:

Thông báo lỗi : Tổng số hình ảnh bị lỗi và hướng dẫn.
Bảng lỗi : Tên tệp, mô tả lỗi dễ hiểu, gợi ý khắc phục và hình thu nhỏ xem trước.
Các lỗi thường gặp bao gồm tệp bị hỏng, định dạng không được hỗ trợ, hình ảnh quá nhỏ (tối thiểu 28px) và chế độ màu không được hỗ trợ.

Các lỗi xử lý thường gặp

Lỗi	Nguyên nhân	Sửa chữa
Không thể đọc tệp hình ảnh	Định dạng bị hỏng hoặc không được hỗ trợ	Xuất lại từ trình chỉnh sửa ảnh
Không đầy đủ hoặc bị hỏng	Tệp tin đã bị cắt bớt trong quá trình truyền tải.	Tải lại tệp gốc
Ảnh quá nhỏ	Kích thước tối thiểu dưới 28px	Sử dụng hình ảnh nguồn có độ phân giải cao hơn.
Chế độ màu không được hỗ trợ	Chế độ màu CMYK hoặc màu được lập chỉ mục	Chuyển đổi sang chế độ RGB

Xuất Tập dữ liệu

Xuất bộ dữ liệu của bạn ở định dạng NDJSON để sử dụng ngoại tuyến:

Nhấp vào biểu tượng tải xuống trong tiêu đề bộ dữ liệu.
Tệp NDJSON được tải xuống tự động.

Ultralytics Xuất tập dữ liệu nền tảng định dạng Ndjson Tải xuống

Định dạng NDJSON lưu trữ một đối tượng JSON trên mỗi dòng. Dòng đầu tiên chứa siêu dữ liệu của tập dữ liệu, tiếp theo là một dòng cho mỗi hình ảnh:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}

URL đã ký

Các URL hình ảnh trong tệp NDJSON đã xuất được ký điện tử và có hiệu lực trong 7 ngày. Nếu bạn cần các URL mới, hãy xuất lại tập dữ liệu.

Xem tài liệu định dạng NDJSON của Ultralytics để biết thông số kỹ thuật đầy đủ.

Vận hành số lượng lớn

Quản lý nhiều hình ảnh cùng lúc bằng menu ngữ cảnh của chế độ xem bảng:

Di chuyển đến Split

Gán lại các hình ảnh đã chọn vào một nhóm khác trong cùng tập dữ liệu:

Chuyển sang chế độ xem dạng bảng
Chọn hình ảnh bằng cách sử dụng hộp kiểm
Nhấp chuột phải để mở menu ngữ cảnh
Chọn Move to split > Huấn luyện, Xác thực, hoặc Kiểm thử

Bạn cũng có thể kéo và thả hình ảnh vào các tab bộ lọc chia nhỏ trong chế độ xem lưới.

Tổ chức phân chia chuyến tàu/val

Tải tất cả hình ảnh lên một tập dữ liệu duy nhất, sau đó sử dụng chức năng "di chuyển hàng loạt đến các tập chia nhỏ" để sắp xếp các tập con thành các tập huấn luyện, xác thực và kiểm tra.

Xóa hàng loạt

Xóa nhiều hình ảnh cùng lúc:

Chọn hình ảnh trong chế độ xem bảng
Nhấp chuột phải và chọn Delete
Xác nhận xóa

URI tập dữ liệu

Tham chiếu các tập dữ liệu Nền tảng bằng cách sử dụng ul:// Định dạng URI (xem Sử dụng tập dữ liệu nền tảng):

ul://username/datasets/dataset-slug

Sử dụng URI này để huấn luyện mô hình từ bất kỳ đâu:

CLIPython

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Huấn luyện mọi nơi với dữ liệu Nền tảng

Hàm ul:// URI hoạt động trong mọi môi trường:

Máy cục bộ: Huấn luyện trên phần cứng của bạn, dữ liệu được tải xuống tự động
Google Colab: Truy cập các tập dữ liệu Nền tảng của bạn trong sổ ghi chép
Máy chủ từ xa: Huấn luyện trên các máy ảo đám mây với quyền truy cập đầy đủ vào tập dữ liệu

Giấy phép hiện có

Nền tảng này hỗ trợ các loại giấy phép sau cho các tập dữ liệu:

Giấy phép	Loại
Không có	Chưa chọn giấy phép nào
CC0-1.0	Thuộc phạm vi công cộng
CC-BY-2.5	Dễ dãi
CC-BY-4.0	Dễ dãi
CC-BY-SA-4.0	Bản quyền
CC-BY-NC-4.0	Phi thương mại
CC-BY-NC-SA-4.0	Bản quyền
CC-BY-ND-4.0	Không có sản phẩm phái sinh
CC-BY-NC-ND-4.0	Phi thương mại
Apache-2.0	Dễ dãi
MIT	Dễ dãi
AGPL-3.0	Bản quyền
GPL-3.0	Bản quyền
Chỉ dành cho nghiên cứu	Hạn chế
Khác	Tùy chỉnh

Giấy phép Copyleft

Khi sao chép một tập dữ liệu có giấy phép copyleft ( AGPL-3.0 (GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), bản sao kế thừa giấy phép và trình chọn giấy phép bị khóa.

Cài đặt hiển thị

Kiểm soát ai có thể xem tập dữ liệu của bạn:

Thiết lập	Mô tả
Riêng tư	Chỉ bạn có thể truy cập
Công khai	Bất kỳ ai cũng có thể xem trên trang Khám phá

Chế độ hiển thị được thiết lập khi tạo tập dữ liệu trong... New Dataset Hộp thoại sử dụng công tắc chuyển đổi. Các tập dữ liệu công khai hiển thị trên đó. Khám phá trang.

Chỉnh sửa Tập dữ liệu

Siêu dữ liệu của tập dữ liệu được chỉnh sửa trực tiếp trên trang tập dữ liệu — không cần hộp thoại nào:

TênNhấp vào tên tập dữ liệu để chỉnh sửa. Các thay đổi sẽ tự động lưu khi bạn chuyển chuột hoặc Enter.
Mô tả : Nhấp vào phần mô tả (hoặc ô "Thêm mô tả...") để chỉnh sửa. Các thay đổi sẽ tự động được lưu.
Loại nhiệm vụ : Nhấp vào biểu tượng nhiệm vụ để chọn loại nhiệm vụ khác.
Giấy phép : Nhấp vào trình chọn giấy phép để thay đổi giấy phép của bộ dữ liệu.

Thay đổi loại nhiệm vụ

Việc thay đổi loại tác vụ có thể ảnh hưởng đến cách hiển thị các chú thích hiện có. Các chú thích không tương thích sẽ không được hiển thị.

Sao chép Tập dữ liệu

Khi xem bộ dữ liệu công khai mà bạn không sở hữu, hãy nhấp vào... Clone Dataset Để tạo một bản sao trong không gian làm việc của bạn. Bản sao bao gồm tất cả hình ảnh, chú thích và định nghĩa lớp. Nếu tập dữ liệu gốc có giấy phép copyleft, bản sao sẽ kế thừa giấy phép đó và trình chọn giấy phép sẽ bị khóa.

Sao : Nhấp vào nút sao để đánh dấu bộ dữ liệu. Số sao đã đánh dấu sẽ hiển thị cho tất cả người dùng.
Chia sẻ : Đối với các bộ dữ liệu công khai, hãy nhấp vào nút chia sẻ để sao chép liên kết hoặc chia sẻ lên các nền tảng mạng xã hội.

Xóa bộ dữ liệu

Xóa tập dữ liệu bạn không còn cần:

Mở menu hành động tập dữ liệu
Nhấp chuột Delete
Xác nhận trong hộp thoại: "Thao tác này sẽ chuyển [tên] vào thùng rác. Bạn có thể khôi phục lại trong vòng 30 ngày."

Thùng rác và Khôi phục

Các bộ dữ liệu đã xóa sẽ được chuyển vào Thùng rác — chứ không bị xóa vĩnh viễn. Bạn có thể khôi phục chúng trong vòng 30 ngày kể từ ngày xóa. Settings > Trash.

Huấn luyện trên tập dữ liệu

Bắt đầu huấn luyện trực tiếp từ tập dữ liệu của bạn:

Nhấp chuột New Model trên trang tập dữ liệu
Chọn một dự án hoặc tạo mới
Cấu hình các tham số huấn luyện
Bắt đầu huấn luyện

graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Xem Huấn luyện trên Đám mây để biết chi tiết.

Câu hỏi thường gặp

Dữ liệu của tôi sẽ được xử lý như thế nào sau khi tải lên?

Dữ liệu của bạn được xử lý và lưu trữ trong khu vực bạn đã chọn (US, EU hoặc AP). Hình ảnh được:

Đã xác thực về định dạng và kích thước
Bị từ chối nếu kích thước tối thiểu nhỏ hơn 28px.
Ảnh sẽ được chuẩn hóa nếu lớn hơn 4096px (giữ nguyên tỷ lệ khung hình; được mã hóa để tối ưu hóa dung lượng lưu trữ).
Được lưu trữ bằng phương thức lưu trữ theo địa chỉ nội dung (CAS) với hàm băm XXH3-128.
Ảnh thu nhỏ được tạo ở độ phân giải 256px WebP để duyệt nhanh.

Lưu trữ hoạt động như thế nào?

Nền tảng Ultralytics sử dụng Lưu trữ dựa trên nội dung (CAS) để lưu trữ hiệu quả:

Khử trùng lặp: Các hình ảnh giống hệt nhau được tải lên bởi những người dùng khác nhau chỉ được lưu trữ một lần
Tính toàn vẹn : Thuật toán băm XXH3-128 đảm bảo tính toàn vẹn dữ liệu.
Hiệu quả: Giảm chi phí lưu trữ và tăng tốc độ xử lý
Theo khu vực: Dữ liệu nằm trong khu vực bạn đã chọn (Mỹ, EU hoặc AP)

Tôi có thể thêm hình ảnh vào một tập dữ liệu hiện có không?

Có, bạn có thể kéo và thả tệp vào trang dữ liệu hoặc sử dụng nút tải lên để thêm hình ảnh bổ sung. Số liệu thống kê mới sẽ được tính toán tự động.

Làm thế nào để di chuyển hình ảnh giữa các màn hình chia đôi?

Sử dụng tính năng di chuyển hàng loạt để chia nhỏ:

Chọn hình ảnh trong chế độ xem bảng
Nhấp chuột phải và chọn Move to split
Chọn tập dữ liệu mục tiêu (Huấn luyện, Xác thực hoặc Kiểm thử)

Những định dạng nhãn nào được hỗ trợ?

Ultralytics Nền tảng hỗ trợ hai định dạng chú thích để tải lên:

Định dạng YOLOCOCO Định dạng

Một .txt Tệp tin cho mỗi hình ảnh với tọa độ chuẩn hóa (phạm vi 0-1):

Tác vụ	Định dạng	Ví dụ
Phát hiện	`class cx cy w h`	`0 0.5 0.5 0.2 0.3`
Phân đoạn	`class x1 y1 x2 y2 ...`	`0 0.1 0.1 0.9 0.1 0.9 0.9`
Pose (Dáng điệu/Tư thế)	`class cx cy w h kx1 ky1 v1 ...`	`0 0.5 0.5 0.2 0.3 0.6 0.7 2`
OBB	`class x1 y1 x2 y2 x3 y3 x4 y4`	`0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9`
Phân loại	Cấu trúc thư mục	`train/cats/`, `train/dogs/`

Các cờ chỉ trạng thái tư thế: 0 = không được gắn nhãn, 1 = được gắn nhãn nhưng bị che khuất, 2 = được gắn nhãn và hiển thị rõ.

Các tệp JSON với images, annotations, và categories mảng. Hỗ trợ phát hiện (bbox), phân đoạn (đa giác) và tư thế (keypoints) nhiệm vụ. COCO Sử dụng tọa độ pixel tuyệt đối, được tự động chuyển đổi sang định dạng chuẩn hóa trong quá trình tải lên.

📅 Được tạo 1 tháng trước ✍️ Cập nhật 5 ngày trước

Bộ dữ liệu

Tải lên Bộ dữ liệu

Các định dạng được hỗ trợ

Chuẩn bị Tập dữ liệu của bạn

Quy trình tải lên

Duyệt hình ảnh

Sắp xếp và lọc

Trình xem toàn màn hình

Lọc theo phân tách

Các tab tập dữ liệu

Tab Hình ảnh

Tab Lớp học

Tab Biểu đồ

Tab Mô hình

Tab Lỗi

Xuất Tập dữ liệu

Vận hành số lượng lớn

Di chuyển đến Split

Xóa hàng loạt

URI tập dữ liệu

Giấy phép hiện có

Cài đặt hiển thị

Chỉnh sửa Tập dữ liệu

Sao chép Tập dữ liệu

Đánh dấu sao và chia sẻ

Xóa bộ dữ liệu

Huấn luyện trên tập dữ liệu

Câu hỏi thường gặp

Dữ liệu của tôi sẽ được xử lý như thế nào sau khi tải lên?

Lưu trữ hoạt động như thế nào?

Tôi có thể thêm hình ảnh vào một tập dữ liệu hiện có không?

Làm thế nào để di chuyển hình ảnh giữa các màn hình chia đôi?

Những định dạng nhãn nào được hỗ trợ?

Bình luận