Đào tạo trên đám mây
Nền tảng Ultralytics Cloud Training cung cấp tính năng huấn luyện chỉ với một cú nhấp chuột trên các GPU đám mây, giúp việc huấn luyện mô hình trở nên dễ dàng mà không cần thiết lập phức tạp. Huấn luyện các mô hình YOLO với luồng số liệu thời gian thực và tính năng tự động lưu điểm kiểm tra.
Huấn luyện từ giao diện người dùng
Bắt đầu huấn luyện trên đám mây trực tiếp từ Nền tảng:
- Điều hướng đến dự án của bạn
- Nhấp vào Huấn luyện Mô hình
- Cấu hình các tham số huấn luyện
- Nhấp vào Bắt đầu Huấn luyện
Bước 1: Chọn tập dữ liệu
Chọn một tập dữ liệu từ các tệp đã tải lên của bạn:
| Tùy chọn | Mô tả |
|---|---|
| Tập dữ liệu của bạn | Các tập dữ liệu bạn đã tải lên |
| Tập dữ liệu công khai | Bộ dữ liệu công khai từ Explore |
Bước 2: Cấu hình mô hình
Chọn mô hình cơ sở và các tham số:
| Tham số | Mô tả | Mặc định |
|---|---|---|
| Mô hình | Kiến trúc cơ bản (YOLO26n, s, m, l, x) | YOLO26n |
| Số epoch | Số lần lặp huấn luyện | 100 |
| Kích thước hình ảnh | Độ phân giải đầu vào | 640 |
| Kích thước lô (Batch Size) | Số mẫu mỗi lần lặp | Tự động |
Bước 3: Chọn GPU
Chọn tài nguyên tính toán của bạn:
| Cấp độ | GPU | VRAM | Giá/giờ | Tốt nhất cho |
|---|---|---|---|---|
| Ngân sách | RTX A2000 | 6 GB | $0.12 | Bộ dữ liệu nhỏ, thử nghiệm |
| Ngân sách | RTX 3080 | 10 GB | $0.25 | Bộ dữ liệu cỡ trung bình |
| Ngân sách | RTX 3080 Ti | 12 GB | $0.30 | Bộ dữ liệu cỡ trung bình |
| Ngân sách | A30 | 24 GB | $0.44 | Kích thước lô hàng lớn hơn |
| Giữa | RTX 4090 | 24 GB | $0.60 | Giá cả/hiệu năng tuyệt vời |
| Giữa | A6000 | 48 GB | $0.90 | Mô hình lớn |
| Giữa | L4 | 24 GB | $0.54 | Tối ưu hóa suy luận |
| Giữa | L40S | 48 GB | $1.72 | Đào tạo theo lô lớn |
| Pro | A100 40GB | 40 GB | $2.78 | Đào tạo sản xuất |
| Pro | A100 80GB | 80 GB | $3.44 | Các mô hình rất lớn |
| Pro | H100 | 80 GB | $5.38 | Đào tạo nhanh nhất |
| Doanh nghiệp | H200 | 141 GB | $5.38 | Hiệu suất tối đa |
| Doanh nghiệp | B200 | 192 GB | $10.38 | Các mô hình lớn nhất |
| Ultralytics | RTX PRO 6000 | 48 GB | $3.68 | Ultralytics cơ sở hạ tầng |
Lựa chọn GPU
- RTX 4090 : Tỷ lệ giá/hiệu năng tốt nhất cho hầu hết các công việc với giá 0,60 đô la/giờ.
- A100 80GB: Yêu cầu cho kích thước batch lớn hoặc các mô hình lớn
- H100/H200 : Hiệu suất tối đa cho việc đào tạo cần tốc độ cao.
- B200 : NVIDIA Kiến trúc Blackwell dành cho các khối lượng công việc tiên tiến
Bước 4: Bắt đầu huấn luyện
Nhấp vào Bắt đầu huấn luyện để khởi chạy tác vụ của bạn. Nền tảng sẽ:
- Cấp phát một phiên bản GPU
- Tải xuống tập dữ liệu của bạn
- Bắt đầu huấn luyện
- Truyền trực tiếp các chỉ số theo thời gian thực
Tín dụng miễn phí
Tài khoản mới nhận được 5 đô la tiền thưởng khi đăng ký (25 đô la cho email công ty) - đủ cho một vài buổi tập luyện. Kiểm tra số dư của bạn trong Cài đặt > Thanh toán.
Giám sát huấn luyện
Xem tiến độ huấn luyện theo thời gian thực:
Số liệu trực tiếp
| Chỉ số | Mô tả |
|---|---|
| Mất mát | Sai số huấn luyện và kiểm định |
| mAP | Giá trị trung bình của Average Precision |
| Độ chính xác | Dự đoán dương tính chính xác |
| Độ nhớ lại | Các sự thật cơ bản được detect |
| Mức sử dụng GPU | Tỷ lệ phần trăm sử dụng GPU |
| Bộ nhớ | Mức sử dụng bộ nhớ GPU |
Điểm kiểm tra
Các điểm kiểm tra được lưu tự động:
- Mỗi epoch: Các trọng số mới nhất được lưu
- Mô hình tốt nhất: Điểm kiểm tra có mAP cao nhất được giữ lại
- Mô hình cuối cùng: Các trọng số khi quá trình huấn luyện hoàn tất
Dừng và tiếp tục
Dừng huấn luyện
Nhấp vào Dừng Huấn luyện để tạm dừng công việc của bạn:
- Điểm kiểm tra hiện tại được lưu
- Phiên bản GPU được giải phóng
- Tín dụng ngừng bị tính phí
Tiếp tục huấn luyện
Tiếp tục từ điểm kiểm tra cuối cùng của bạn:
- Điều hướng đến mô hình
- Nhấp vào Tiếp tục Huấn luyện
- Xác nhận tiếp tục
Hạn chế khi tiếp tục
Bạn chỉ có thể tiếp tục quá trình huấn luyện đã được dừng một cách rõ ràng. Các công việc huấn luyện thất bại có thể cần phải bắt đầu lại từ đầu.
Huấn luyện từ xa
Huấn luyện trên phần cứng của riêng bạn trong khi truyền các chỉ số đến Nền tảng.
Yêu cầu phiên bản gói
Tích hợp Nền tảng yêu cầu ultralytics>=8.4.0. Các phiên bản thấp hơn sẽ KHÔNG hoạt động với Nền tảng.
pip install "ultralytics>=8.4.0"
Thiết lập khóa API
- Đi tới Cài đặt > Khóa API
- Tạo khóa mới với phạm vi huấn luyện
- Đặt biến môi trường:
export ULTRALYTICS_API_KEY="your_api_key"
Huấn luyện với truyền phát
Sử dụng project và name các tham số để truyền các chỉ số:
yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(
data="coco.yaml",
epochs=100,
project="username/my-project",
name="experiment-1",
)
Sử dụng tập dữ liệu nền tảng
Huấn luyện với các tập dữ liệu được lưu trữ trên Nền tảng:
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
Hàm ul:// Định dạng URI tự động tải xuống và cấu hình tập dữ liệu của bạn.
Thanh toán
Chi phí huấn luyện dựa trên mức sử dụng GPU:
Ước tính chi phí
Trước khi khóa đào tạo bắt đầu, nền tảng sẽ ước tính tổng chi phí dựa trên:
Estimated Cost = Base Time × Model Multiplier × Dataset Multiplier × GPU Speed Factor × GPU Rate
Các yếu tố ảnh hưởng đến chi phí:
| Nhân tố | Sự va chạm |
|---|---|
| Kích thước tập dữ liệu | Càng nhiều hình ảnh = thời gian huấn luyện càng lâu. |
| Kích thước mô hình | Các mô hình lớn hơn (m, l, x) huấn luyện chậm hơn so với (n, s). |
| Số lượng kỷ nguyên | Hệ số nhân trực tiếp lên thời gian đào tạo |
| Kích thước hình ảnh | Kích thước ảnh lớn hơn sẽ làm tăng khả năng tính toán. |
| GPU Tốc độ | GPU nhanh hơn giúp giảm thời gian huấn luyện. |
Ví dụ về chi phí
| Kịch bản | GPU | Thời gian | Chi phí |
|---|---|---|---|
| 1000 ảnh, YOLO26n, 100 chu kỳ | RTX 4090 | ~1 giờ | ~0,60 đô la |
| 5000 hình ảnh, YOLO26m, 100 chu kỳ | A100 80GB | ~4 giờ | ~13,76 đô la |
| 10000 ảnh, YOLO26x, 200 chu kỳ | H100 | ~8 giờ | ~43,04 đô la |
Hệ thống Giữ/Thanh toán
Nền tảng này sử dụng mô hình thanh toán bảo vệ người tiêu dùng:
- Ước tính : Chi phí được tính toán trước khi khóa đào tạo bắt đầu.
- Giữ lại : Số tiền ước tính + 20% dự phòng từ số dư
- Tàu : Số tiền đã đặt trước được hiển thị là "Đã đặt trước" trong số dư của bạn.
- Thanh toán : Sau khi hoàn tất, chỉ tính phí cho phần thực tế phát sinh. GPU thời gian sử dụng
- Hoàn tiền : Mọi khoản tiền thừa sẽ tự động được hoàn trả vào số dư của bạn.
Bảo vệ người tiêu dùng
Bạn không bao giờ bị tính phí cao hơn ước tính được hiển thị trước khi huấn luyện. Nếu quá trình huấn luyện hoàn tất sớm hoặc bị hủy, bạn chỉ phải trả phí cho thời gian tính toán thực tế đã sử dụng.
Phương thức thanh toán
| Phương thức | Mô tả |
|---|---|
| Số dư tài khoản | Số dư nạp trước |
| Thanh toán theo công việc | Tính phí khi hoàn thành công việc |
Số dư tối thiểu
Cần có số dư tối thiểu 5,00 USD để bắt đầu quá trình huấn luyện dựa trên epoch.
Xem chi phí huấn luyện
Sau khi huấn luyện, xem chi phí chi tiết trong tab Thanh toán:
- Phân tích chi phí theo từng epoch
- Tổng thời gian GPU
- Tải báo cáo chi phí
Mẹo huấn luyện
Chọn kích thước mô hình phù hợp
| Mô hình | Tham số | Tốt nhất cho |
|---|---|---|
| YOLO26n | 2.4M | Thiết bị biên, thời gian thực |
| YOLO26s | 9.5M | Cân bằng tốc độ/độ chính xác |
| YOLO26m | 20.4M | Độ chính xác cao hơn |
| YOLO26l | 24.8M | Độ chính xác cấp sản xuất |
| YOLO26x | 55.7M | Độ chính xác tối đa |
Tối ưu thời gian huấn luyện
- Bắt đầu với quy mô nhỏ: Thử nghiệm với ít epoch hơn trước
- Sử dụng GPU phù hợp: Ghép nối GPU với mô hình/kích thước batch
- Xác thực tập dữ liệu: Đảm bảo chất lượng trước khi huấn luyện
- Giám sát sớm: Dừng lại nếu các chỉ số chững lại
Khắc phục sự cố
| Vấn đề | Giải pháp |
|---|---|
| Huấn luyện bị kẹt ở 0% | Kiểm tra định dạng tập dữ liệu, thử lại |
| Hết bộ nhớ | Giảm kích thước batch hoặc sử dụng GPU lớn hơn |
| Độ chính xác kém | Tăng số epoch, kiểm tra chất lượng dữ liệu |
| Huấn luyện chậm | Cân nhắc GPU nhanh hơn |
Câu hỏi thường gặp
Thời gian huấn luyện mất bao lâu?
Thời gian huấn luyện phụ thuộc vào:
- Kích thước tập dữ liệu
- Kích thước mô hình
- Số lượng epoch
- GPU được chọn
Thời gian điển hình (1000 ảnh, 100 epoch):
| Mô hình | RTX 4090 | A100 |
|---|---|---|
| YOLO26n | 30 phút | 20 phút |
| YOLO26m | 60 phút | 40 phút |
| YOLO26x | 120 phút | 80 phút |
Có thể huấn luyện qua đêm không?
Có, quá trình huấn luyện sẽ tiếp tục cho đến khi hoàn thành. Bạn sẽ nhận được thông báo khi quá trình huấn luyện kết thúc. Đảm bảo tài khoản của bạn có đủ số dư cho việc huấn luyện dựa trên epoch.
Điều gì xảy ra nếu tôi hết tín dụng?
Quá trình huấn luyện tạm dừng vào cuối epoch hiện tại. Điểm kiểm tra của bạn được lưu và bạn có thể tiếp tục sau khi nạp thêm tín dụng.
Có thể sử dụng các đối số huấn luyện tùy chỉnh không?
Có, người dùng nâng cao có thể chỉ định các đối số bổ sung trong cấu hình huấn luyện.
Tham khảo tham số huấn luyện
Tham số cốt lõi
| Tham số | Loại | Mặc định | Phạm vi | Mô tả |
|---|---|---|---|---|
epochs | int | 100 | 1+ | Số epoch huấn luyện |
batch | int | 16 | -1 = tự động | Kích thước batch (-1 cho tự động) |
imgsz | int | 640 | 32+ | Kích thước ảnh đầu vào |
patience | int | 100 | 0+ | Ngưỡng dừng sớm |
workers | int | 8 | 0+ | Số worker của dataloader |
cache | boolean | Sai | - | Bộ nhớ đệm ảnh (RAM/ổ đĩa) |
Tham số tốc độ học
| Tham số | Loại | Mặc định | Phạm vi | Mô tả |
|---|---|---|---|---|
lr0 | số thực | 0.01 | 0.0-1.0 | Tốc độ học ban đầu |
lrf | số thực | 0.01 | 0.0-1.0 | Hệ số LR cuối cùng |
momentum | số thực | 0.937 | 0.0-1.0 | Động lượng SGD |
weight_decay | số thực | 0.0005 | 0.0-1.0 | Chuẩn hóa L2 |
warmup_epochs | số thực | 3.0 | 0+ | Số lượng epochs Warmup |
cos_lr | boolean | Sai | - | Bộ lập lịch LR Cosine |
Tham số tăng cường dữ liệu
| Tham số | Loại | Mặc định | Phạm vi | Mô tả |
|---|---|---|---|---|
hsv_h | số thực | 0.015 | 0.0-1.0 | Tăng cường sắc độ HSV |
hsv_s | số thực | 0.7 | 0.0-1.0 | Độ bão hòa HSV |
hsv_v | số thực | 0.4 | 0.0-1.0 | Giá trị HSV |
degrees | số thực | 0.0 | - | Góc xoay |
translate | số thực | 0.1 | 0.0-1.0 | Phần dịch chuyển |
scale | số thực | 0.5 | 0.0-1.0 | Hệ số tỷ lệ |
fliplr | số thực | 0.5 | 0.0-1.0 | Xác suất lật ngang |
flipud | số thực | 0.0 | 0.0-1.0 | Xác suất lật dọc |
mosaic | số thực | 1.0 | 0.0-1.0 | Tăng cường Mosaic |
mixup | số thực | 0.0 | 0.0-1.0 | Tăng cường MixUp |
copy_paste | số thực | 0.0 | 0.0-1.0 | Sao chép-dán (segment) |
Lựa chọn bộ tối ưu hóa
| Giá trị | Mô tả |
|---|---|
auto | Lựa chọn tự động (mặc định) |
SGD | Giảm độ dốc ngẫu nhiên |
Adam | Bộ tối ưu hóa Adam |
AdamW | Adam với suy giảm trọng số |
Tham số dành riêng cho tác vụ
Một số tham số chỉ áp dụng cho các tác vụ cụ thể:
- Phân đoạn:
overlap_mask,mask_ratio,copy_paste - Pose (Dáng điệu/Tư thế):
pose(trọng số mất mát),kobj(mức độ đối tượng của điểm khóa) - Phân loại:
dropout,erasing,auto_augment