Huấn luyện model

Ultralytics Platform cung cấp các công cụ toàn diện để huấn luyện các model YOLO, từ việc tổ chức các thử nghiệm đến chạy các job huấn luyện trên đám mây với tính năng truyền phát số liệu theo thời gian thực.



Watch: Get Started with Ultralytics Platform - Train

Tổng quan

Phần Huấn luyện giúp bạn:

  • Tổ chức các model vào các project để quản lý dễ dàng hơn
  • Huấn luyện trên GPU đám mây chỉ với một cú nhấp chuột
  • Giám sát các số liệu thời gian thực trong quá trình huấn luyện
  • So sánh hiệu suất model giữa các thử nghiệm
  • Xuất sang hơn 17 định dạng triển khai (xem các định dạng được hỗ trợ)

Ultralytics Platform Train Overview

Quy trình làm việc

graph LR
    A[📁 Project] --> B[⚙️ Configure]
    B --> C[🚀 Train]
    C --> D[📈 Monitor]
    D --> E[📦 Export]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
    style E fill:#00BCD4,color:#fff
Giai đoạnMô tả
ProjectTạo workspace để tổ chức các model liên quan
Cấu hìnhChọn dataset, model cơ sở và các tham số huấn luyện
Huấn luyệnChạy trên GPU đám mây hoặc phần cứng cục bộ của bạn
Giám sátXem các đường cong loss và số liệu theo thời gian thực
XuấtChuyển đổi sang hơn 17 định dạng triển khai (chi tiết)

Các tùy chọn huấn luyện

Ultralytics Platform hỗ trợ nhiều phương pháp huấn luyện:

Phương phápMô tảTốt nhất cho
Cloud TrainingHuấn luyện trên GPU đám mây của UltralyticsKhông cần GPU cục bộ, khả năng mở rộng cao
Local TrainingHuấn luyện cục bộ, truyền phát số liệu đến nền tảngTận dụng phần cứng hiện có, bảo mật dữ liệu
Colab TrainingSử dụng Google Colab với sự tích hợp của nền tảngTruy cập GPU miễn phí

Các tùy chọn GPU

Các GPU khả dụng cho huấn luyện đám mây trên Ultralytics Cloud:

GPUThế hệVRAMChi phí/GiờTốt nhất cho
RTX 2000 AdaAda16 GB$0.24Dataset nhỏ, kiểm thử
RTX A4500Ampere20 GB$0.25Dataset nhỏ-trung bình
RTX 4000 AdaAda20 GB$0.26Dataset trung bình
RTX A5000Ampere24 GB$0.27Dataset trung bình
L4Ada24 GB$0.39Tối ưu cho Inference
A40Ampere48 GB$0.44Kích thước batch lớn hơn
RTX 3090Ampere24 GB$0.46Huấn luyện chung
RTX A6000Ampere48 GB$0.49Các model lớn
RTX PRO 4500Blackwell32 GB$0.64Giá/hiệu năng tuyệt vời
RTX 4090Ada24 GB$0.69Giá/hiệu năng tốt nhất
RTX 6000 AdaAda48 GB$0.77Huấn luyện theo lô lớn
L40SAda48 GB$0.86Huấn luyện theo lô lớn
RTX 5090Blackwell32 GB$0.99Thế hệ người dùng mới nhất
L40Ada48 GB$0.99Các model lớn
A100 PCIeAmpere80 GB$1.39Huấn luyện sản xuất
A100 SXMAmpere80 GB$1.49Huấn luyện sản xuất
RTX PRO 6000Blackwell96 GB$1.89Mặc định được đề xuất
H100 PCIeHopper80 GB$2.39Huấn luyện hiệu suất cao
H100 SXMHopper80 GB$2.99Huấn luyện nhanh nhất
H100 NVLHopper94 GB$3.07Hiệu suất tối đa
H200 NVLHopper143 GB$3.39Bộ nhớ tối đa
H200 SXMHopper141 GB$3.99Hiệu suất tối đa
B200Blackwell180 GB$5.49Các model lớn (Pro+)
B300Blackwell288 GB$7.39Các model lớn nhất (Pro+)
Truy cập gói GPU

Các GPU B200 và B300 yêu cầu gói Pro hoặc Enterprise. Tất cả các GPU khác đều khả dụng trên mọi gói, bao gồm gói Free.

Credit đăng ký

Các tài khoản mới nhận được credit đăng ký để huấn luyện. Kiểm tra Thanh toán để biết chi tiết.

Số liệu thời gian thực

Trong quá trình huấn luyện, hãy xem các số liệu trực tiếp qua ba tab phụ:

graph LR
    A[Charts] --> B[Loss Curves]
    A --> C[Performance Metrics]
    D[Console] --> E[Live Logs]
    D --> F[Error Detection]
    G[System] --> H[GPU Utilization]
    G --> I[Memory & Temp]

    style A fill:#2196F3,color:#fff
    style D fill:#FF9800,color:#fff
    style G fill:#9C27B0,color:#fff
Tab phụSố liệu
Biểu đồBox/class/DFL loss, mAP50, mAP50-95, precision, recall
Bảng điều khiểnLog huấn luyện trực tiếp với mã màu ANSI và phát hiện lỗi
Hệ thốngMức sử dụng GPU, bộ nhớ, nhiệt độ, CPU, ổ đĩa
Checkpoint tự động

Đối với huấn luyện đám mây, model tốt nhất (best.pt, checkpoint có mAP cao nhất) được lưu tự động và khả dụng để tải xuống, xuất và triển khai sau khi hoàn tất huấn luyện.

Bắt đầu nhanh

Bắt đầu với huấn luyện đám mây trong vòng chưa đầy một phút:

  1. Tạo một project trong thanh bên
  2. Nhấp vào New Model
  3. Chọn một model, dataset và GPU
  4. Nhấp vào Start Training

Liên kết nhanh

  • Projects: Tổ chức các model và thử nghiệm của bạn
  • Models: Quản lý các checkpoint đã huấn luyện
  • Cloud Training: Huấn luyện trên GPU đám mây

Câu hỏi thường gặp (FAQ)

Huấn luyện mất bao lâu?

Thời gian huấn luyện phụ thuộc vào:

  • Kích thước dataset (số lượng hình ảnh)
  • Kích thước model (n, s, m, l, x)
  • Số lượng epoch
  • Loại GPU được chọn

Một lần chạy huấn luyện điển hình với 1000 hình ảnh, YOLO26n, 100 epoch trên RTX PRO 6000 mất khoảng 2-3 giờ. Các lần chạy nhỏ hơn (500 hình ảnh, 50 epoch trên RTX 4090) hoàn thành trong vòng chưa đầy một giờ. Xem các ví dụ về chi phí để biết ước tính chi tiết.

Tôi có thể huấn luyện nhiều model cùng lúc không?

Có. Giới hạn huấn luyện đám mây đồng thời phụ thuộc vào gói của bạn: Free cho phép 3, Pro cho phép 10 và Enterprise là không giới hạn. Để huấn luyện song song nhiều hơn, hãy sử dụng huấn luyện từ xa từ nhiều máy.

Điều gì xảy ra nếu huấn luyện thất bại?

Nếu huấn luyện thất bại:

  1. Các checkpoint được lưu tại mỗi epoch
  2. Bạn có thể tiếp tục từ checkpoint cuối cùng
  3. Credit chỉ bị trừ cho thời gian tính toán đã hoàn thành

Làm thế nào để tôi chọn GPU phù hợp?

Kịch bảnGPU khuyến nghị
Hầu hết các job huấn luyệnRTX PRO 6000
Các dataset hoặc batch size lớnH100 SXM hoặc H200
Ưu tiên tiết kiệm ngân sáchRTX 4090

Bình luận