Triển khai
Ultralytics Platform cung cấp các tùy chọn triển khai toàn diện để đưa các mô hình YOLO của bạn vào sản xuất. Kiểm tra mô hình với suy luận dựa trên trình duyệt, triển khai tới các điểm cuối chuyên dụng trên 43 khu vực toàn cầu và giám sát hiệu suất theo thời gian thực.
Xem: Bắt đầu với Ultralytics Nền tảng - Triển khai
Tổng quan
Phần Triển khai giúp bạn:
- Kiểm thử các mô hình trực tiếp trong trình duyệt với
Predicttab - Triển khai đến các điểm cuối chuyên dụng tại 43 khu vực toàn cầu
- Giám sát các chỉ số yêu cầu, nhật ký và kiểm tra tình trạng
- Giảm quy mô về 0 khi không hoạt động (hiện tại các triển khai chỉ chạy một phiên bản hoạt động duy nhất)

Tùy chọn triển khai
Ultralytics Platform cung cấp nhiều lộ trình triển khai:
| Tùy chọn | Mô tả | Tốt nhất cho |
|---|---|---|
| Tab Dự đoán | Suy luận trên trình duyệt với hình ảnh, webcam và ví dụ | Phát triển, xác thực |
| Suy luận dùng chung | Dịch vụ đa người dùng trên 3 khu vực | Sử dụng nhẹ, kiểm thử |
| Điểm cuối chuyên dụng | Dịch vụ dành riêng cho từng khách hàng tại 43 khu vực. | Sản xuất, độ trễ thấp |
Quy trình làm việc
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Giai đoạn | Mô tả |
|---|---|
| Kiểm thử | Xác thực mô hình với Predict tab |
| Cấu hình | Chọn khu vực và tên triển khai (việc triển khai sử dụng các tài nguyên mặc định cố định) |
| Triển khai | Tạo một điểm cuối chuyên dụng từ Deploy tab |
| Giám sát | Theo dõi các yêu cầu, độ trễ, lỗi và nhật ký trong phần Giám sát. |
Kiến trúc
Suy luận dùng chung
Dịch vụ suy luận dùng chung hoạt động ở 3 khu vực chính, tự động định tuyến yêu cầu dựa trên khu vực dữ liệu của bạn:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff
| Khu vực | Vị trí |
|---|---|
| Mỹ | Iowa, Hoa Kỳ |
| EU | Bỉ, Châu Âu |
| AP | Hồng Kông, Châu Á-Thái Bình Dương |
Điểm cuối chuyên dụng
Triển khai đến 43 khu vực trên toàn thế giới trên Ultralytics Cloud:
- Châu Mỹ: 14 khu vực
- Châu Âu: 13 khu vực
- Châu Á - Thái Bình Dương: 12 khu vực
- Trung Đông & Châu Phi: 4 khu vực
Mỗi điểm cuối là một dịch vụ đơn người thuê với:
- Tài nguyên mặc định của
1 CPU,2 GiBký ức,minInstances=0,maxInstances=1 - Đặt về 0 khi ở trạng thái nghỉ
- URL điểm cuối duy nhất
- Giám sát độc lập, nhật ký và kiểm tra sức khỏe.
Trang Triển khai
Truy cập trang triển khai toàn cầu từ thanh bên dưới mục Deploy. Trang này hiển thị:
- Bản đồ thế giới với các ghim khu vực đã triển khai (bản đồ tương tác)
- Thẻ tổng quan: Tổng số yêu cầu (24h), Triển khai đang hoạt động, Tỷ lệ lỗi (24h), Độ trễ P95 (24h)
- Danh sách triển khai với ba chế độ xem: thẻ, gọn và bảng
- Triển khai mới nút để tạo điểm cuối từ bất kỳ mô hình đã hoàn thành nào

Tự động thăm dò
Trang này thường xuyên kiểm tra trạng thái mỗi 15 giây. Khi quá trình triển khai đang trong giai đoạn chuyển tiếp (creating, deploying, hoặc stopping), tần suất lấy mẫu tăng lên mỗi 3 giây để phản hồi nhanh hơn.
Các tính năng chính
Phạm vi toàn cầu
Triển khai gần người dùng của bạn với 43 khu vực bao phủ:
- Bắc Mỹ, Nam Mỹ
- Châu Âu, Trung Đông, Châu Phi
- Châu Á Thái Bình Dương, Châu Đại Dương
Hành vi tỷ lệ
Hiện tại, các điểm cuối hoạt động như sau:
- Tự động giảm về 0: Không tốn chi phí khi không hoạt động (mặc định)
- Phiên bản hoạt động duy nhất:
maxInstanceshiện đang được giới hạn ở mức1trên tất cả các kế hoạch
Tiết kiệm chi phí
Chế độ thu nhỏ về 0 được bật theo mặc định (số lượng mẫu tối thiểu = 0). Bạn chỉ trả tiền cho thời gian suy luận thực tế.
Độ trễ thấp
Các điểm cuối chuyên dụng cung cấp:
- Khởi động nguội: ~5-15 giây (container đã lưu cache), lên đến ~45 giây (triển khai lần đầu)
- Suy luận nóng: 50-200ms (tùy thuộc vào mô hình)
- Định tuyến theo khu vực để đạt hiệu suất tối ưu
Khám sức khỏe
Mỗi lần triển khai đều bao gồm một bước kiểm tra trạng thái tự động với các bước sau:
- Chỉ báo trạng thái trực tiếp (khỏe mạnh/không khỏe mạnh)
- Hiển thị độ trễ phản hồi
- Tự động thử lại khi không ổn định (kiểm tra mỗi 20 giây)
- Nút làm mới thủ công
Bắt đầu nhanh
Triển khai một mô hình trong vòng chưa đầy 2 phút:
- Huấn luyện hoặc tải mô hình lên dự án
- Vào tab Triển khai của mô hình.
- Chọn một khu vực từ bảng độ trễ.
- Nhấp vào Triển khai — điểm cuối của bạn đã hoạt động
Triển khai nhanh
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
Sau khi triển khai, hãy sử dụng URL điểm cuối cùng cùng với khóa API của bạn để gửi yêu cầu suy luận từ bất kỳ ứng dụng nào.
Liên kết nhanh
- Suy luận: Kiểm tra mô hình trong trình duyệt
- Điểm cuối: Triển khai các điểm cuối chuyên dụng
- Giám sát: Theo dõi hiệu suất triển khai
Câu hỏi thường gặp
Sự khác biệt giữa suy luận dùng chung và suy luận chuyên dụng là gì?
| Tính năng | Đã chia sẻ | Chuyên dụng |
|---|---|---|
| Độ trễ | Biến đổi | Ổn định |
| Chi phí | Miễn phí (đã bao gồm) | Miễn phí (cơ bản), tính phí theo mức sử dụng (nâng cao) |
| Tỉ lệ | Hạn chế | Thu nhỏ về 0, một trường hợp duy nhất |
| Khu vực | 3 | 43 |
| URL | Tổng quát | Tùy chỉnh |
| Mức phí | 20 yêu cầu/phút | Không giới hạn |
Việc triển khai mất bao lâu?
Triển khai điểm cuối chuyên dụng thường mất 1-2 phút:
- Kéo ảnh (~30 giây)
- Khởi động container (~30 giây)
- Kiểm tra tình trạng (~30 giây)
Tôi có thể triển khai nhiều mô hình không?
Có, mỗi mô hình có thể có nhiều điểm cuối ở các khu vực khác nhau. Số lượng triển khai bị giới hạn theo gói: Miễn phí 3, Chuyên nghiệp 10Doanh nghiệp unlimited.
Điều gì xảy ra khi một điểm cuối không hoạt động?
Khi bật tính năng tự động giảm về 0:
- Điểm cuối giảm quy mô sau khi không hoạt động
- Yêu cầu đầu tiên kích hoạt khởi động nguội
- Các yêu cầu tiếp theo sẽ nhanh
Các yêu cầu đầu tiên sau một khoảng thời gian không hoạt động sẽ kích hoạt quá trình khởi động nguội.