Chuẩn bị dữ liệu
Chuẩn bị dữ liệu là nền tảng của các mô hình thị giác máy tính thành công. Nền tảng Ultralytics cung cấp các công cụ toàn diện để quản lý dữ liệu huấn luyện của bạn, từ tải lên, chú thích đến phân tích.
Tổng quan
Phần Dữ liệu của Ultralytics Nền tảng này giúp bạn:
- Tải lên hình ảnh, video và tệp lưu trữ ZIP.
- Chú thích bằng các công cụ thủ công và gắn nhãn hỗ trợ bởi AI
- Phân tích dữ liệu của bạn bằng số liệu thống kê và hình ảnh trực quan.
- Xuất dữ liệu ở định dạng tiêu chuẩn để phục vụ đào tạo tại địa phương.
Quy trình làm việc
graph LR
A[📤 Upload] --> B[🏷️ Annotate]
B --> C[📊 Analyze]
C --> D[🚀 Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Sân khấu | Mô tả |
|---|---|
| Tải lên | Nhập hình ảnh, video hoặc tệp lưu trữ ZIP với khả năng xử lý tự động. |
| Chú thích | Gắn nhãn dữ liệu bằng các hộp giới hạn, đa giác, điểm đặc trưng hoặc phân loại. |
| Phân tích | Xem phân bố lớp, bản đồ nhiệt không gian và thống kê kích thước. |
| Xuất | Tải xuống ở định dạng NDJSON để sử dụng ngoại tuyến. |
Các Tác Vụ Được Hỗ Trợ
Ultralytics Nền tảng hỗ trợ cả 5 YOLO các loại nhiệm vụ:
| Tác vụ | Mô tả | Công cụ chú thích |
|---|---|---|
| Phát hiện | Phát hiện đối tượng bằng hộp giới hạn | Công cụ hình chữ nhật |
| Phân đoạn | Phân đoạn đối tượng bằng mặt nạ pixel | Công cụ đa giác |
| Pose (Dáng điệu/Tư thế) | Ước tính điểm mấu chốt (17 điểm) COCO định dạng) | Công cụ điểm mấu chốt |
| OBB | Các hộp giới hạn định hướng cho các đối tượng xoay | Công cụ hộp định hướng |
| Phân loại | Phân loại ở cấp độ hình ảnh | Bộ chọn lớp |
Các tính năng chính
Lưu trữ thông minh
Ultralytics Nền tảng sử dụng công nghệ lưu trữ hiệu quả:
- Loại bỏ trùng lặp : Các hình ảnh giống hệt nhau chỉ được lưu trữ một lần.
- Tính toàn vẹn : Mã kiểm tra đảm bảo tính toàn vẹn của dữ liệu.
- Hiệu quả : Tối ưu hóa lưu trữ và xử lý nhanh chóng
URI tập dữ liệu
Bộ dữ liệu tham chiếu sử dụng ul:// Định dạng URI:
yolo train data=ul://username/datasets/my-dataset
Điều này cho phép huấn luyện trên các tập dữ liệu của Nền tảng từ bất kỳ máy nào có cấu hình khóa API của bạn.
Thống kê và Trực quan hóa
Mỗi tập dữ liệu đều bao gồm thống kê tự động:
- Phân bố theo lớp : Biểu đồ cột thể hiện số lượng nhãn trên mỗi lớp.
- Bản đồ nhiệt vị trí : Phân bố không gian của các chú thích
- Phân tích kích thước : Phân bố chiều rộng và chiều cao của hình ảnh
- Phân bổ dữ liệu : Số lượng mẫu huấn luyện/kiểm chứng/thử nghiệm
Liên kết nhanh
- Bộ dữ liệu : Tải lên và quản lý dữ liệu huấn luyện của bạn
- Chú thích : Gắn nhãn dữ liệu bằng các công cụ thủ công và hỗ trợ bởi trí tuệ nhân tạo.
Câu hỏi thường gặp
Những định dạng tệp nào được hỗ trợ để tải lên?
Ultralytics Nền tảng hỗ trợ:
- Hình ảnh : JPG, PNG, WebP, TIFF, BMP và các định dạng phổ biến khác.
- Video : MP4, AVI, MOV - các khung hình được trích xuất tự động.
- Lưu trữ : Các tệp ZIP chứa hình ảnh với tùy chọn YOLO -định dạng nhãn
Kích thước tập dữ liệu tối đa là bao nhiêu?
Giới hạn dung lượng lưu trữ phụ thuộc vào gói dịch vụ của bạn:
| Kế hoạch | Giới hạn lưu trữ |
|---|---|
| Miễn phí | 100 GB |
| Pro | 500 GB |
| Doanh nghiệp | Tùy chỉnh |
Tôi có thể sử dụng bộ dữ liệu nền tảng của mình để huấn luyện cục bộ không?
Đúng vậy! Hãy sử dụng định dạng URI của tập dữ liệu để huấn luyện cục bộ:
export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100
Hoặc xuất bộ dữ liệu của bạn ở định dạng NDJSON để huấn luyện hoàn toàn ngoại tuyến.