Triển khai
Ultralytics Platform cung cấp các tùy chọn triển khai toàn diện để đưa các mô hình YOLO của bạn vào sản xuất. Kiểm tra mô hình với Inference API, triển khai đến các điểm cuối chuyên dụng và giám sát hiệu suất theo thời gian thực.
Tổng quan
Phần Triển khai giúp bạn:
- Kiểm tra mô hình trực tiếp trong trình duyệt
- Triển khai đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu
- Giám sát các chỉ số yêu cầu và nhật ký
- Mở rộng quy mô tự động theo lưu lượng truy cập
Tùy chọn triển khai
Ultralytics Platform cung cấp nhiều lộ trình triển khai:
| Tùy chọn | Mô tả | Tốt nhất cho |
|---|---|---|
| Tab kiểm tra | Kiểm thử suy luận dựa trên trình duyệt | Phát triển, xác thực |
| API dùng chung | Dịch vụ suy luận đa người thuê | Sử dụng nhẹ, kiểm thử |
| Điểm cuối chuyên dụng | Dịch vụ sản xuất đơn người thuê | Sản xuất, độ trễ thấp |
Quy trình làm việc
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Giai đoạn | Mô tả |
|---|---|
| Kiểm thử | Xác thực mô hình với sample_images |
| Cấu hình | Chọn khu vực và tùy chọn mở rộng quy mô |
| Triển khai | Tạo điểm cuối chuyên dụng |
| Giám sát | track các yêu cầu, độ trễ và lỗi |
Kiến trúc
Suy luận dùng chung
Dịch vụ suy luận chia sẻ hoạt động tại 3 khu vực chính:
| Khu vực | Vị trí |
|---|---|
| Mỹ | Iowa, Hoa Kỳ |
| EU | Bỉ, Châu Âu |
| AP | Đài Loan, khu vực Châu Á - Thái Bình Dương |
Các yêu cầu được định tuyến đến khu vực dữ liệu của bạn một cách tự động.
Điểm cuối chuyên dụng
Triển khai tại 43 khu vực trên toàn thế giới:
- Châu Mỹ: 15 khu vực
- Châu Âu: 12 khu vực
- Châu Á Thái Bình Dương: 16 khu vực
Mỗi điểm cuối là một dịch vụ đơn người thuê với:
- Tài nguyên tính toán chuyên dụng
- Tự động điều chỉnh quy mô (0-N phiên bản)
- URL tùy chỉnh
- Giám sát độc lập
Các tính năng chính
Phạm vi toàn cầu
Triển khai gần người dùng của bạn với 43 khu vực bao phủ:
- Bắc Mỹ, Nam Mỹ
- Châu Âu, Trung Đông, Châu Phi
- Châu Á Thái Bình Dương, Châu Đại Dương
Tự động điều chỉnh quy mô
Các điểm cuối tự động điều chỉnh quy mô:
- Điều chỉnh về 0: Không tốn chi phí khi không hoạt động
- Mở rộng quy mô: Xử lý các đợt tăng đột biến lưu lượng truy cập
- Giới hạn có thể cấu hình: Đặt số phiên bản tối thiểu/tối đa
Độ trễ thấp
Các điểm cuối chuyên dụng cung cấp:
- Khởi động lạnh: ~2-5 giây
- Suy luận nóng: 50-200ms (tùy thuộc vào mô hình)
- Định tuyến theo khu vực để đạt hiệu suất tối ưu
Liên kết nhanh
- Suy luận: Kiểm tra mô hình trong trình duyệt
- Điểm cuối: Triển khai các điểm cuối chuyên dụng
- Giám sát: Theo dõi hiệu suất triển khai
Câu hỏi thường gặp
Sự khác biệt giữa suy luận dùng chung và suy luận chuyên dụng là gì?
| Tính năng | Đã chia sẻ | Chuyên dụng |
|---|---|---|
| Độ trễ | Biến đổi | Ổn định |
| Chi phí | Thanh toán theo yêu cầu | Thanh toán theo thời gian hoạt động |
| Tỉ lệ | Hạn chế | Có thể cấu hình |
| Khu vực | 3 | 43 |
| URL | Tổng quát | Tùy chỉnh |
Việc triển khai mất bao lâu?
Triển khai điểm cuối chuyên dụng thường mất 1-2 phút:
- Kéo ảnh (~30 giây)
- Khởi động container (~30 giây)
- Kiểm tra tình trạng (~30 giây)
Tôi có thể triển khai nhiều mô hình không?
Có, mỗi mô hình có thể có nhiều điểm cuối ở các khu vực khác nhau. Không có giới hạn về tổng số điểm cuối (tùy thuộc vào gói của bạn).
Điều gì xảy ra khi một điểm cuối không hoạt động?
Khi bật tính năng tự động giảm về 0:
- Điểm cuối giảm quy mô sau khi không hoạt động
- Yêu cầu đầu tiên kích hoạt khởi động nguội
- Các yêu cầu tiếp theo sẽ nhanh
Để tránh khởi động nguội, hãy đặt số lượng phiên bản tối thiểu > 0.