Link to this sectionDedicated Endpoints#
Ultralytics Platform cho phép triển khai các model YOLO tới những endpoint chuyên dụng tại 43 khu vực trên toàn cầu. Mỗi endpoint là một dịch vụ đơn thuê bao (single-tenant) với khả năng scale-to-zero, URL endpoint duy nhất và cơ chế giám sát độc lập.

Link to this sectionTạo Endpoint#
Link to this sectionTừ Tab Triển Khai (Deploy)#
Triển khai model từ tab Deploy của nó:
- Điều hướng tới model của bạn
- Nhấp vào tab Deploy
- Chọn một khu vực từ bản đồ thế giới tương tác — các khu vực được mã màu theo độ trễ từ vị trí của bạn trên dải màu từ xanh lá cây sang đỏ (khu vực nhanh hơn có màu xanh hơn, khu vực chậm hơn có màu đỏ hơn)
- Nhấp Deploy trên hàng khu vực tương ứng
Tên triển khai được tự động tạo từ tên model và thành phố khu vực (ví dụ: yolo26n-iowa).
Link to this sectionTừ Trang Triển Khai (Deployments)#
Tạo một triển khai từ trang Deploy chung trong thanh bên:
- Nhấp New Deployment
- Chọn một model từ bộ chọn model
- Chọn một khu vực từ bản đồ hoặc bảng
- Xem lại tên triển khai được tự động tạo (có thể chỉnh sửa) và các tài nguyên mặc định
- Nhấp Deploy Model

Link to this sectionVòng đời Triển khai#
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteLink to this sectionChọn khu vực#
Chọn từ 43 khu vực trên toàn thế giới. Bản đồ và bảng khu vực tương tác hiển thị:
- Ghim khu vực: Được mã màu theo độ trễ trên dải màu từ xanh lá cây sang đỏ (khu vực nhanh hơn có màu xanh hơn, khu vực chậm hơn có màu đỏ hơn)
- Khu vực đã triển khai: Được làm nổi bật với huy hiệu "Deployed"
- Khu vực đang triển khai: Chỉ báo dạng xung nhịp
- Làm nổi bật hai chiều: Di chuột trên bản đồ làm nổi bật hàng bảng và ngược lại

Bảng khu vực trên tab Deploy của model bao gồm:
| Cột | Mô tả |
|---|---|
| Vị trí (Location) | Thành phố và quốc gia kèm biểu tượng cờ |
| Zone (Khu vực) | Định danh khu vực |
| Độ trễ | Thời gian ping đo được (trung vị của 3 lần ping) |
| Khoảng cách (Distance) | Khoảng cách từ vị trí của bạn tính bằng km |
| Hành động (Actions) | Nút Deploy hoặc huy hiệu trạng thái "Deployed" |
Hộp thoại New Deployment (từ trang Deploy chung) hiển thị một bảng khu vực đơn giản hơn chỉ với các cột Vị trí, Độ trễ và Chọn.
Chọn khu vực gần nhất với người dùng của bạn để có độ trễ thấp nhất. Sử dụng nút Rescan để đo lại độ trễ từ vị trí hiện tại của bạn.
Link to this sectionCác Khu Vực Khả Dụng#
| Zone | Vị trí |
|---|---|
| us-central1 | Iowa, Mỹ |
| us-east1 | South Carolina, USA |
| us-east4 | Northern Virginia, USA |
| us-east5 | Columbus, USA |
| us-south1 | Dallas, USA |
| us-west1 | Oregon, USA |
| us-west2 | Los Angeles, USA |
| us-west3 | Salt Lake City, USA |
| us-west4 | Las Vegas, USA |
| northamerica-northeast1 | Montreal, Canada |
| northamerica-northeast2 | Toronto, Canada |
| northamerica-south1 | Queretaro, Mexico |
| southamerica-east1 | Sao Paulo, Brazil |
| southamerica-west1 | Santiago, Chile |
Link to this sectionCấu hình Endpoint#
Link to this sectionHộp Thoại Triển Khai Mới#
Hộp thoại New Deployment cung cấp:
| Cài đặt | Mô tả | Mặc định |
|---|---|---|
| Model | Chọn từ các model đã hoàn thiện | - |
| Region | Khu vực triển khai | - |
| Deployment Name | Tự động tạo, có thể chỉnh sửa | - |
| CPU Cores | Mặc định cố định | 1 |
| Memory (GB) | Mặc định cố định | 2 |

Các triển khai sử dụng giá trị mặc định cố định là 1 CPU, 2 GiB bộ nhớ, minInstances = 0 và maxInstances = 1. Chúng tự động co giãn về 0 khi nhàn rỗi, vì vậy bạn chỉ trả phí cho thời gian suy luận thực tế.
Tên triển khai được tạo tự động từ tên model và thành phố thuộc region (ví dụ: yolo26n-iowa). Nếu bạn triển khai cùng một model vào cùng một region lần nữa, một hậu tố số sẽ được thêm vào (ví dụ: yolo26n-iowa-2).
Link to this sectionTab Deploy (Triển khai nhanh)#
Khi triển khai từ tab Deploy của model, các endpoint được tạo với tài nguyên mặc định (1 CPU, 2 GB bộ nhớ) với tính năng co giãn về 0 được bật. Tên triển khai được tạo tự động.
Link to this sectionQuản lý Endpoint#
Link to this sectionChế độ xem#
Danh sách triển khai hỗ trợ ba chế độ xem:
| Chế độ | Mô tả |
|---|---|
| Cards | Thẻ chi tiết đầy đủ với nhật ký, ví dụ mã, bảng dự đoán |
| Compact | Lưới các thẻ nhỏ hơn với các chỉ số chính |
| Table | DataTable với các cột có thể sắp xếp và tìm kiếm |

Link to this sectionThẻ triển khai (Chế độ xem thẻ)#
Mỗi thẻ triển khai trong chế độ xem thẻ hiển thị:
- Header: Tên, cờ region, trạng thái, các nút start/stop/delete
- Endpoint URL: URL có thể sao chép với liên kết đến tài liệu API
- Metrics: Số lượng yêu cầu (24h), độ trễ P95, tỷ lệ lỗi
- Health check: Chỉ báo trạng thái trực tiếp với độ trễ và làm mới thủ công
- Tabs:
Logs,Code, vàPredict
Tab Logs hiển thị các mục nhật ký gần đây với bộ lọc mức độ nghiêm trọng (Tất cả / Lỗi). Tab Code hiển thị các ví dụ mã sẵn sàng sử dụng bằng Python, JavaScript và cURL với URL endpoint và API key thực tế của bạn. Tab Predict cung cấp bảng dự đoán nội dòng để kiểm thử trực tiếp trên triển khai.
Link to this sectionTrạng thái triển khai#
| Trạng thái | Mô tả |
|---|---|
| Creating | Triển khai đang được thiết lập |
| Deploying | Container đang khởi động |
| Ready | Endpoint đang trực tuyến và chấp nhận yêu cầu |
| Stopping | Endpoint đang tắt |
| Stopped | Endpoint đã tạm dừng (không tính phí) |
| Failed | Triển khai thất bại (xem thông báo lỗi) |
Link to this sectionEndpoint URL#
Mỗi endpoint có một URL duy nhất, ví dụ:
https://predict-abc123.run.app

Nhấp vào nút sao chép để sao chép URL. Nhấp vào biểu tượng tài liệu để xem tài liệu API được tự động tạo cho endpoint.
Link to this sectionQuản lý vòng đời#
Kiểm soát trạng thái endpoint của bạn:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Hành động | Mô tả |
|---|---|
| Start | Tiếp tục chạy một endpoint đã dừng |
| Stop | Tạm dừng endpoint (không tính phí) |
| Delete | Xóa vĩnh viễn endpoint |
Link to this sectionDừng Endpoint#
Dừng endpoint để tạm dừng tính phí:
- Nhấp vào biểu tượng tạm dừng trên thẻ triển khai
- Trạng thái endpoint chuyển sang "Stopping" sau đó là "Stopped"
Các endpoint đã dừng:
- Không chấp nhận yêu cầu
- Không phát sinh chi phí
- Có thể được khởi động lại bất cứ lúc nào
Link to this sectionXóa Endpoint#
Xóa vĩnh viễn một endpoint:
- Nhấp vào biểu tượng xóa (thùng rác) trên thẻ triển khai
- Xác nhận xóa trong hộp thoại
Việc xóa diễn ra ngay lập tức và vĩnh viễn. Bạn luôn có thể tạo một endpoint mới.
Link to this sectionSử dụng Endpoint#
Link to this sectionXác thực#
Mỗi triển khai được tạo với một API key từ tài khoản của bạn. Hãy bao gồm nó trong các yêu cầu:
Authorization: Bearer YOUR_API_KEYTiền tố API key được hiển thị ở phần chân trang của thẻ triển khai để nhận diện. Tạo key từ API Keys.
Link to this sectionKhông có giới hạn tốc độ#
Các yêu cầu gửi trực tiếp tới URL endpoint chuyên dụng của bạn không bị giới hạn bởi giới hạn tốc độ Platform API — thông lượng chỉ bị giới hạn bởi CPU, bộ nhớ và cấu hình mở rộng của endpoint. (Các yêu cầu được chuyển tiếp qua Platform API, ví dụ như trình kiểm tra trong trình duyệt, vẫn sử dụng giới hạn dự đoán tiêu chuẩn là 20 yêu cầu/phút.) Đây là ưu điểm chính so với inference chia sẻ, vốn bị giới hạn ở mức 20 yêu cầu/phút cho mỗi API key.
Link to this sectionVí dụ về yêu cầu#
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Link to this sectionTham số yêu cầu#
| Tham số | Loại | Mặc định | Phạm vi | Mô tả |
|---|---|---|---|---|
file | tệp | - | - | Tệp hình ảnh hoặc video (bắt buộc) |
conf | float | 0.25 | 0.01 – 1.0 | Ngưỡng độ tin cậy tối thiểu |
iou | float | 0.7 | 0.0 – 0.95 | Ngưỡng NMS IoU |
imgsz | int | 640 | 32 – 1280 | Kích thước hình ảnh đầu vào tính bằng pixel |
normalize | bool | false | - | Trả về tọa độ BBox dưới dạng 0 – 1 |
decimals | int | 5 | 0 – 10 | Độ chính xác thập phân cho các giá trị tọa độ |
source | string | - | - | URL hình ảnh hoặc chuỗi base64 (thay thế cho file) |
Các endpoint chuyên dụng chấp nhận cả hình ảnh và video thông qua tham số file.
- Định dạng hình ảnh (tối đa 100 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Định dạng video (tối đa 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Mỗi khung hình video được xử lý riêng biệt và kết quả được trả về theo từng khung hình. Bạn cũng có thể truyền URL hình ảnh công khai hoặc hình ảnh đã mã hóa base64 thông qua tham số source thay vì file.
Link to this sectionĐịnh dạng phản hồi#
Tương tự như inference chia sẻ với các trường cụ thể theo tác vụ.
Link to this sectionGiá cả#
Các endpoint chuyên dụng cơ bản được miễn phí trên mọi gói. Các cấu hình tài nguyên cao hơn (nhiều vCPU hơn, nhiều bộ nhớ hơn, khởi động nóng) sẽ cung cấp giá theo mức sử dụng trong tương lai.
- Sử dụng tính năng scale-to-zero (mặc định) để các endpoint chỉ chạy khi nhận được yêu cầu
- Thiết lập số lượng instance tối đa phù hợp cho lưu lượng truy cập của bạn
- Giám sát mức sử dụng trong bảng điều khiển Monitoring
Link to this sectionCâu hỏi thường gặp#
Link to this sectionTôi có thể tạo bao nhiêu endpoint?#
Giới hạn endpoint phụ thuộc vào gói của bạn:
- Free: Tối đa 3 lần triển khai
- Pro: Tối đa 10 lần triển khai
- Enterprise: Triển khai không giới hạn
Mỗi model vẫn có thể được triển khai tới nhiều khu vực trong hạn mức gói của bạn.
Link to this sectionTôi có thể thay đổi khu vực sau khi triển khai không?#
Không, các khu vực là cố định. Để thay đổi khu vực:
- Xóa endpoint hiện tại
- Tạo một endpoint mới trong khu vực mong muốn
Link to this sectionLàm thế nào để xử lý việc triển khai đa khu vực?#
Để phủ sóng toàn cầu:
- Triển khai tới nhiều khu vực
- Sử dụng bộ cân bằng tải hoặc định tuyến DNS
- Định tuyến người dùng đến endpoint gần nhất
Link to this sectionThời gian cold start là bao lâu?#
Thời gian cold start phụ thuộc vào kích thước model và việc container đã được lưu trong bộ nhớ đệm tại khu vực đó hay chưa. Các phạm vi điển hình:
| Kịch bản | Cold Start |
|---|---|
| Container đã lưu bộ nhớ đệm | ~5-15 giây |
| Lần triển khai/khu vực đầu tiên | ~15-45 giây |
Kiểm tra tình trạng sử dụng thời gian chờ 55 giây để xử lý các trường hợp cold start lâu nhất.
Link to this sectionTôi có thể sử dụng tên miền tùy chỉnh không?#
Tên miền tùy chỉnh sẽ sớm ra mắt. Hiện tại, các endpoint sử dụng URL do nền tảng tạo.