Chuẩn bị dữ liệu
Chuẩn bị dữ liệu là nền tảng của các mô hình thị giác máy tính thành công. Nền tảng Ultralytics cung cấp các công cụ toàn diện để quản lý dữ liệu huấn luyện của bạn, từ tải lên, chú thích đến phân tích.
Tổng quan
Mục Dữ liệu của Nền tảng Ultralytics giúp bạn:
- Tải lên hình ảnh, video và các tệp lưu trữ (ZIP, TAR, GZ)
- Chú thích bằng các công cụ vẽ thủ công và SAM -ghi nhãn thông minh được hỗ trợ bởi
- Phân tích dữ liệu của bạn bằng thống kê và trực quan hóa
- Xuất ở định dạng NDJSON để phục vụ đào tạo tại địa phương

Quy trình làm việc
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Giai đoạn | Mô tả |
|---|---|
| Tải lên | Nhập hình ảnh, video hoặc tệp lưu trữ với quy trình xử lý tự động. |
| Chú thích | Gắn nhãn dữ liệu bằng hộp giới hạn, đa giác, điểm khóa hoặc phân loại |
| Phân tích | Xem phân bố lớp, bản đồ nhiệt không gian và thống kê kích thước |
| Xuất | Tải xuống ở định dạng NDJSON để sử dụng ngoại tuyến. |
Các Tác Vụ Được Hỗ Trợ
Nền tảng Ultralytics hỗ trợ tất cả 5 loại tác vụ YOLO:
| Tác vụ | Mô tả | Công cụ chú thích |
|---|---|---|
| Phát hiện | Object detect với hộp giới hạn | Công cụ hình chữ nhật |
| Phân đoạn | Instance segment với mặt nạ pixel | Công cụ đa giác |
| Pose (Dáng điệu/Tư thế) | Ước tính điểm khóa (định dạng COCO 17 điểm) | Công cụ điểm mốc |
| OBB | Hộp giới hạn có hướng cho các đối tượng xoay | Công cụ hộp có hướng |
| Phân loại | Phân loại cấp độ ảnh | Bộ chọn lớp |
Lựa chọn loại nhiệm vụ
Loại tác vụ được thiết lập khi tạo tập dữ liệu và xác định các công cụ chú thích nào có sẵn. Bạn có thể thay đổi nó sau này từ cài đặt tập dữ liệu, nhưng các chú thích không tương thích sẽ không được hiển thị sau khi thay đổi.
Các tính năng chính
Lưu trữ thông minh
Ultralytics Nền tảng này sử dụng bộ nhớ dựa trên địa chỉ nội dung (CAS) để quản lý dữ liệu hiệu quả:
- Khử trùng lặp : Các hình ảnh giống hệt nhau chỉ được lưu trữ một lần thông qua thuật toán băm XXH3-128.
- Tính toàn vẹn : Phương thức định địa chỉ dựa trên hàm băm đảm bảo tính toàn vẹn của dữ liệu.
- Hiệu quả: Lưu trữ tối ưu và xử lý nhanh
URI tập dữ liệu
Tham chiếu bộ dữ liệu sử dụng ul:// Định dạng URI (xem Sử dụng tập dữ liệu nền tảng):
yolo train data=ul://username/datasets/my-dataset
Điều này cho phép huấn luyện trên các tập dữ liệu của nền tảng từ bất kỳ máy nào có cấu hình khóa API của bạn.
Sử dụng dữ liệu nền tảng từ Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Các tab tập dữ liệu
Mỗi trang dữ liệu đều có năm tab:
| Tab | Mô tả |
|---|---|
| Ảnh | Xem hình ảnh ở chế độ lưới, thu gọn hoặc bảng với lớp phủ chú thích. |
| Các lớp học | Xem và chỉnh sửa tên lớp, màu sắc và số lượng nhãn cho mỗi lớp. |
| Biểu đồ | Thống kê tự động: phân bổ theo tỷ lệ, số lượng theo lớp, bản đồ nhiệt. |
| Mô hình | Các mô hình được huấn luyện trên tập dữ liệu này cùng với các chỉ số và trạng thái. |
| Lỗi | Hình ảnh không xử lý được, kèm theo chi tiết lỗi và hướng dẫn khắc phục. |
Thống kê và Trực quan hóa
Hàm Charts Tab này cung cấp chức năng phân tích tự động, bao gồm:
- Phân bổ chia nhỏ : Biểu đồ hình bánh vòng thể hiện số lượng ảnh huấn luyện/xác thực/kiểm tra.
- Các lớp hàng đầu : Biểu đồ hình bánh vòng thể hiện các lớp chú thích thường xuyên nhất.
- Độ rộng ảnh : Biểu đồ phân bố độ rộng ảnh
- Chiều cao ảnh : Biểu đồ phân bố chiều cao ảnh
- Điểm trên mỗi trường hợp : Phân bố số lượng đỉnh hoặc điểm đặc trưng của đa giác ( segment /bộ dữ liệu tư thế)
- Vị trí chú thích : Bản đồ nhiệt 2D về vị trí tâm của các hộp giới hạn.
- Kích thước hình ảnh : Bản đồ nhiệt 2D về chiều rộng so với chiều cao kèm theo hướng dẫn tỷ lệ khung hình.
Liên kết nhanh
- Tập dữ liệu: Tải lên và quản lý dữ liệu huấn luyện của bạn
- Chú thích: Gắn nhãn dữ liệu bằng các công cụ thủ công và hỗ trợ bởi AI
Câu hỏi thường gặp
Những định dạng tệp nào được hỗ trợ để tải lên?
Nền tảng Ultralytics hỗ trợ:
Hình ảnh: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (tối đa 50MB mỗi loại)
Video: MP4, WebM, MOV, AVI, MKV, M4V (tối đa 1GB, trích xuất khung hình ở tốc độ 1 FPS, tối đa 100 khung hình)
Tệp lưu trữ: ZIP, TAR, TAR.GZ, TGZ, GZ (tối đa 10GB) chứa hình ảnh với nhãn định dạng YOLO tùy chọn.
Kích thước tập dữ liệu tối đa là bao nhiêu?
Giới hạn lưu trữ phụ thuộc vào gói của bạn:
| Gói | Giới hạn lưu trữ |
|---|---|
| Miễn phí | 100 GB |
| Pro | 500 GB |
| Doanh nghiệp | Tùy chỉnh |
Giới hạn dung lượng từng tập tin: Hình ảnh 50MB, Video 1GB, Tập tin nén 10GB
Tôi có thể sử dụng các bộ dữ liệu Nền tảng của mình để huấn luyện cục bộ không?
Có! Sử dụng định dạng URI tập dữ liệu để huấn luyện cục bộ:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Hoặc xuất bộ dữ liệu của bạn ở định dạng NDJSON để huấn luyện hoàn toàn ngoại tuyến.