Chuyển đến nội dung

Chuẩn bị dữ liệu

Chuẩn bị dữ liệu là nền tảng của các mô hình thị giác máy tính thành công. Nền tảng Ultralytics cung cấp các công cụ toàn diện để quản lý dữ liệu huấn luyện của bạn, từ tải lên, chú thích đến phân tích.

Tổng quan

Mục Dữ liệu của Nền tảng Ultralytics giúp bạn:

  • Tải lên hình ảnh, video và tệp lưu trữ ZIP
  • Chú thích bằng công cụ thủ công và gắn nhãn có hỗ trợ AI
  • Phân tích dữ liệu của bạn bằng thống kê và trực quan hóa
  • Xuất theo các định dạng tiêu chuẩn để huấn luyện cục bộ

Quy trình làm việc

graph LR
    A[📤 Upload] --> B[🏷️ Annotate]
    B --> C[📊 Analyze]
    C --> D[🚀 Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
Giai đoạnMô tả
Tải lênNhập hình ảnh, video hoặc tệp lưu trữ ZIP với xử lý tự động
Chú thíchGắn nhãn dữ liệu bằng hộp giới hạn, đa giác, điểm khóa hoặc phân loại
Phân tíchXem phân bố lớp, bản đồ nhiệt không gian và thống kê kích thước
XuấtTải xuống ở định dạng NDJSON để sử dụng ngoại tuyến

Các Tác Vụ Được Hỗ Trợ

Nền tảng Ultralytics hỗ trợ tất cả 5 loại tác vụ YOLO:

Tác vụMô tảCông cụ chú thích
Phát hiệnObject detect với hộp giới hạnCông cụ hình chữ nhật
Phân đoạnInstance segment với mặt nạ pixelCông cụ đa giác
Pose (Dáng điệu/Tư thế)Ước tính điểm khóa (định dạng COCO 17 điểm)Công cụ điểm mốc
OBBHộp giới hạn có hướng cho các đối tượng xoayCông cụ hộp có hướng
Phân loạiPhân loại cấp độ ảnhBộ chọn lớp

Các tính năng chính

Lưu trữ thông minh

Nền tảng Ultralytics sử dụng công nghệ lưu trữ hiệu quả:

  • Khử trùng lặp: Các hình ảnh giống hệt nhau chỉ được lưu trữ một lần
  • Toàn vẹn dữ liệu: Tổng kiểm tra (checksum) đảm bảo tính toàn vẹn của dữ liệu
  • Hiệu quả: Lưu trữ tối ưu và xử lý nhanh

URI tập dữ liệu

Tham chiếu bộ dữ liệu sử dụng ul:// định dạng URI:

yolo train data=ul://username/datasets/my-dataset

Điều này cho phép huấn luyện trên các bộ dữ liệu của Nền tảng từ bất kỳ máy nào đã cấu hình khóa API của bạn.

Thống kê và Trực quan hóa

Mỗi bộ dữ liệu bao gồm các thống kê tự động:

  • Phân bố lớp: Biểu đồ cột số lượng nhãn trên mỗi lớp
  • Bản đồ nhiệt vị trí: Phân bố không gian của các chú thích
  • Phân tích kích thước: Phân bố chiều rộng so với chiều cao của ảnh
  • Phân tích phân chia: Số lượng mẫu huấn luyện/kiểm định/kiểm tra
  • Tập dữ liệu: Tải lên và quản lý dữ liệu huấn luyện của bạn
  • Chú thích: Gắn nhãn dữ liệu bằng các công cụ thủ công và hỗ trợ bởi AI

Câu hỏi thường gặp

Những định dạng tệp nào được hỗ trợ để tải lên?

Nền tảng Ultralytics hỗ trợ:

Hình ảnh: JPEG, PNG, WebP, BMP, GIF, TIFF, HEIC, AVIF, JP2, DNG (tối đa 50MB mỗi loại)

Video: MP4, WebM, MOV, AVI, MKV, M4V (tối đa 1GB, trích xuất khung hình ở tốc độ 1 FPS, tối đa 100 khung hình)

Lưu trữ: Các tệp ZIP (tối đa 50GB) chứa hình ảnh kèm tùy chọn YOLO -định dạng nhãn

Kích thước tập dữ liệu tối đa là bao nhiêu?

Giới hạn lưu trữ phụ thuộc vào gói của bạn:

GóiGiới hạn lưu trữ
Miễn phí100 GB
Pro500 GB
Doanh nghiệpTùy chỉnh

Giới hạn dung lượng từng tập tin: Hình ảnh 50MB, Video 1GB, Tập tin nén ZIP 50GB

Tôi có thể sử dụng các bộ dữ liệu Nền tảng của mình để huấn luyện cục bộ không?

Có! Sử dụng định dạng URI tập dữ liệu để huấn luyện cục bộ:

export ULTRALYTICS_API_KEY="your_key"
yolo train data=ul://username/datasets/my-dataset epochs=100

Hoặc xuất tập dữ liệu của bạn theo định dạng NDJSON để huấn luyện hoàn toàn ngoại tuyến.



📅 Được tạo 20 ngày trước ✏️ Cập nhật 12 ngày trước
glenn-jocher

Bình luận