Chuẩn bị dữ liệu
Chuẩn bị dữ liệu là nền tảng của các mô hình thị giác máy tính thành công. Nền tảng Ultralytics cung cấp các công cụ toàn diện để quản lý dữ liệu huấn luyện của bạn, từ tải lên, chú thích đến phân tích.
Tổng quan
Mục Dữ liệu của Nền tảng Ultralytics giúp bạn:
- Tải lên hình ảnh, video và tệp lưu trữ ZIP
- Chú thích bằng công cụ thủ công và gắn nhãn có hỗ trợ AI
- Phân tích dữ liệu của bạn bằng thống kê và trực quan hóa
- Xuất theo các định dạng tiêu chuẩn để huấn luyện cục bộ
Quy trình làm việc
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Giai đoạn | Mô tả |
|---|---|
| Tải lên | Nhập hình ảnh, video hoặc tệp lưu trữ ZIP với xử lý tự động |
| Chú thích | Gắn nhãn dữ liệu bằng hộp giới hạn, đa giác, điểm khóa hoặc phân loại |
| Phân tích | Xem phân bố lớp, bản đồ nhiệt không gian và thống kê kích thước |
| Xuất | Tải xuống ở định dạng NDJSON để sử dụng ngoại tuyến |
Các Tác Vụ Được Hỗ Trợ
Nền tảng Ultralytics hỗ trợ tất cả 5 loại tác vụ YOLO:
| Tác vụ | Mô tả | Công cụ chú thích |
|---|---|---|
| Phát hiện | Object detect với hộp giới hạn | Công cụ hình chữ nhật |
| Phân đoạn | Instance segment với mặt nạ pixel | Công cụ đa giác |
| Pose (Dáng điệu/Tư thế) | Ước tính điểm khóa (định dạng COCO 17 điểm) | Công cụ điểm mốc |
| OBB | Hộp giới hạn có hướng cho các đối tượng xoay | Công cụ hộp có hướng |
| Phân loại | Phân loại cấp độ ảnh | Bộ chọn lớp |
Các tính năng chính
Lưu trữ thông minh
Nền tảng Ultralytics sử dụng công nghệ lưu trữ hiệu quả:
- Khử trùng lặp: Các hình ảnh giống hệt nhau chỉ được lưu trữ một lần
- Toàn vẹn dữ liệu: Tổng kiểm tra (checksum) đảm bảo tính toàn vẹn của dữ liệu
- Hiệu quả: Lưu trữ tối ưu và xử lý nhanh
URI tập dữ liệu
Tham chiếu bộ dữ liệu sử dụng ul:// định dạng URI:
yolo train data=ul://username/datasets/my-dataset
Điều này cho phép huấn luyện trên các bộ dữ liệu của Nền tảng từ bất kỳ máy nào đã cấu hình khóa API của bạn.
Thống kê và Trực quan hóa
Mỗi bộ dữ liệu bao gồm các thống kê tự động:
- Phân bố lớp: Biểu đồ cột số lượng nhãn trên mỗi lớp
- Bản đồ nhiệt vị trí: Phân bố không gian của các chú thích
- Phân tích kích thước: Phân bố chiều rộng so với chiều cao của ảnh
- Phân tích phân chia: Số lượng mẫu huấn luyện/kiểm định/kiểm tra
Liên kết nhanh
- Tập dữ liệu: Tải lên và quản lý dữ liệu huấn luyện của bạn
- Chú thích: Gắn nhãn dữ liệu bằng các công cụ thủ công và hỗ trợ bởi AI
Câu hỏi thường gặp
Những định dạng tệp nào được hỗ trợ để tải lên?
Nền tảng Ultralytics hỗ trợ:
Hình ảnh: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (tối đa 50MB mỗi loại)
Video: MP4, WebM, MOV, AVI, MKV, M4V (tối đa 1GB, trích xuất khung hình ở tốc độ 1 FPS, tối đa 100 khung hình)
Lưu trữ: Các tệp ZIP (tối đa 50GB) chứa hình ảnh kèm tùy chọn YOLO -định dạng nhãn
Kích thước tập dữ liệu tối đa là bao nhiêu?
Giới hạn lưu trữ phụ thuộc vào gói của bạn:
| Gói | Giới hạn lưu trữ |
|---|---|
| Miễn phí | 100 GB |
| Pro | 500 GB |
| Doanh nghiệp | Tùy chỉnh |
Giới hạn dung lượng từng tập tin: Hình ảnh 50MB, Video 1GB, Tập tin nén ZIP 50GB
Tôi có thể sử dụng các bộ dữ liệu Nền tảng của mình để huấn luyện cục bộ không?
Có! Sử dụng định dạng URI tập dữ liệu để huấn luyện cục bộ:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
Hoặc xuất tập dữ liệu của bạn theo định dạng NDJSON để huấn luyện hoàn toàn ngoại tuyến.