Link to this sectionGiám sát#
Ultralytics Platform cung cấp tính năng giám sát cho các endpoint đã triển khai. Theo dõi các số liệu yêu cầu, xem nhật ký và kiểm tra trạng thái hoạt động với cơ chế tự động thăm dò (polling).

Link to this sectionBảng điều khiển triển khai#
Trang Deploy ở thanh bên đóng vai trò là bảng điều khiển giám sát cho tất cả các bản triển khai của bạn. Trang này kết hợp bản đồ thế giới, số liệu tổng quan và quản lý triển khai trong một chế độ xem duy nhất. Xem Dedicated Endpoints để biết cách tạo và quản lý các bản triển khai.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this sectionThẻ tổng quan#
Bốn thẻ tóm tắt ở đầu trang hiển thị:

| Chỉ số | Mô tả |
|---|---|
| Tổng số yêu cầu (24h) | Số lượng yêu cầu trên tất cả các endpoint |
| Triển khai đang hoạt động | Các endpoint đang chạy hiện tại |
| Tỷ lệ lỗi (24h) | Phần trăm các yêu cầu thất bại |
| Độ trễ P95 (24h) | Thời gian phản hồi ở phân vị thứ 95 |
Thẻ tỷ lệ lỗi sẽ sáng lên màu đỏ khi tỷ lệ này vượt quá 5%. Hãy kiểm tra tab Logs trên từng bản triển khai để chẩn đoán lỗi.
Link to this sectionBản đồ thế giới#
Bản đồ tương tác thế giới hiển thị:
- Ghim vùng cho tất cả 43 vùng khả dụng
- Ghim màu xanh lá cho các vùng đã triển khai
- Ghim xanh dương động cho các vùng đang có triển khai thực thi
- Kích thước ghim thay đổi dựa trên trạng thái triển khai và độ trễ

Link to this sectionDanh sách triển khai#
Bên dưới các thẻ tổng quan, danh sách triển khai hiển thị tất cả các endpoint trong các dự án của bạn. Sử dụng nút chuyển chế độ xem để thay đổi giữa:
| Xem | Mô tả |
|---|---|
| Cards | Thẻ chi tiết đầy đủ với các tab số liệu, nhật ký, mã nguồn và dự đoán |
| Compact | Lưới các thẻ nhỏ (1-4 cột) với các số liệu chính |
| Table | DataTable với các cột có thể sắp xếp: Tên, Vùng, Trạng thái, Yêu cầu, P95, Lỗi |
Bảng điều khiển tự động thăm dò mỗi 15 giây để cập nhật trạng thái triển khai. Khi các bản triển khai ở trạng thái chuyển tiếp (creating, deploying hoặc stopping), tần suất thăm dò sẽ tăng lên mỗi 3 giây. Biểu đồ số liệu làm mới sau mỗi 60 giây. Nhấp vào nút làm mới để cập nhật ngay lập tức.
Link to this sectionSố liệu theo từng bản triển khai#
Mỗi thẻ triển khai (trong chế độ xem thẻ) hiển thị số liệu thời gian thực:
Link to this sectionHàng số liệu#
| Chỉ số | Mô tả |
|---|---|
| Yêu cầu | Số lượng yêu cầu (24h) kèm biểu tượng |
| Độ trễ P95 | Thời gian phản hồi ở phân vị thứ 95 |
| Tỷ lệ lỗi | Phần trăm các yêu cầu thất bại |
Các số liệu được lấy từ endpoint API sparkline và làm mới mỗi 60 giây.
Link to this sectionKiểm tra tình trạng#
Các bản triển khai đang chạy hiển thị chỉ báo kiểm tra sức khỏe:
| Chỉ báo | Ý nghĩa |
|---|---|
| Trái tim màu xanh lá | Khỏe mạnh — hiển thị độ trễ phản hồi |
| Trái tim màu đỏ | Không khỏe mạnh — hiển thị thông báo lỗi |
| Biểu tượng xoay vòng | Đang thực hiện kiểm tra sức khỏe |
Các đợt kiểm tra sức khỏe sẽ tự động thử lại sau mỗi 20 giây khi ở trạng thái không khỏe mạnh. Nhấp vào biểu tượng làm mới để kích hoạt kiểm tra sức khỏe thủ công. Quá trình kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để thích ứng với các trạng thái khởi động lạnh (cold start) trên các endpoint mở rộng về 0.

Việc kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để tính đến các trường hợp khởi động lạnh trên các endpoint mở rộng về 0 (tối đa ~45 giây trong trường hợp xấu nhất). Sau khi endpoint đã sẵn sàng, các đợt kiểm tra sức khỏe sẽ hoàn tất trong vài mili giây.
Link to this sectionNhật ký#
Mỗi thẻ triển khai bao gồm tab Logs để xem các mục nhật ký gần đây:

Link to this sectionMục nhật ký#
Mỗi mục nhật ký hiển thị:
| Trường (Field) | Mô tả |
|---|---|
| Mức độ nghiêm trọng | Thanh mã màu (xem bên dưới) |
| Dấu thời gian | Thời gian yêu cầu (định dạng địa phương) |
| Thông điệp | Nội dung nhật ký |
| Thông tin HTTP | Mã trạng thái và độ trễ (nếu có) |
Lọc nhật ký theo mức độ nghiêm trọng bằng cách sử dụng các nút lọc:
| Mức độ | Màu sắc | Mô tả |
|---|---|---|
| DEBUG | Xám | Các thông điệp gỡ lỗi |
| INFO | Xanh dương | Các yêu cầu bình thường |
| WARNING | Vàng | Các vấn đề không nghiêm trọng |
| ERROR | Đỏ | Các yêu cầu thất bại |
| CRITICAL | Đỏ sẫm | Các lỗi nghiêm trọng |
Giao diện hiển thị 20 mục gần nhất. API mặc định cung cấp 50 mục mỗi yêu cầu (tối đa 200).
Khi điều tra lỗi: trước tiên hãy nhấp vào Errors để lọc các mục ERROR và WARNING, sau đó xem xét dấu thời gian và mã trạng thái HTTP. Sao chép nhật ký vào bảng tạm để chia sẻ với nhóm của bạn.
Link to this sectionVí dụ mã nguồn#
Mỗi thẻ triển khai bao gồm tab Code hiển thị mã API sẵn sàng sử dụng với URL endpoint thực tế và API key của bạn:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Khi xem tab Code trên nền tảng, URL endpoint và API key thực tế của bạn sẽ được tự động điền vào. Sao chép mã nguồn và chạy trực tiếp. Xem API Keys để tạo khóa.
Link to this sectionSuy luận triển khai#
Tab Predict trên mỗi thẻ triển khai cung cấp bảng dự đoán nội dòng — cùng giao diện với tab Predict của model, nhưng thực hiện inference thông qua endpoint triển khai thay vì dịch vụ dùng chung. Điều này hữu ích cho việc kiểm thử một endpoint đã triển khai trực tiếp từ trình duyệt. Xem Inference để biết chi tiết tham số và định dạng phản hồi.
Link to this sectionCác API Endpoints#
Link to this sectionTổng quan về giám sát#
GET /api/monitoringTrả về các số liệu tổng hợp cho tất cả các triển khai thuộc sở hữu của người dùng đã xác thực. Nhận biết không gian làm việc (workspace) thông qua tham số truy vấn owner tùy chọn.
Link to this sectionSố liệu triển khai#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24hTrả về dữ liệu biểu đồ sparkline và các số liệu tóm tắt cho một triển khai cụ thể. Khoảng thời gian làm mới: 60 giây.
| Tham số | Loại | Mô tả |
|---|---|---|
sparkline | bool | Bao gồm dữ liệu sparkline |
range | string | Phạm vi thời gian: 1h, 6h, 24h, 7d, hoặc 30d |
Link to this sectionNhật ký triển khai#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNINGTrả về các mục nhật ký gần đây với bộ lọc mức độ nghiêm trọng tùy chọn và phân trang.
| Tham số | Loại | Mô tả |
|---|---|---|
limit | int | Số mục tối đa được trả về (mặc định: 50, tối đa: 200) |
severity | string | Bộ lọc mức độ nghiêm trọng phân tách bằng dấu phẩy |
pageToken | string | Token phân trang từ phản hồi trước đó |
Link to this sectionTình trạng triển khai#
GET /api/deployments/{deploymentId}/healthTrả về trạng thái kiểm tra tình trạng (health check) cùng với độ trễ phản hồi.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this sectionTối ưu hóa hiệu suất#
Sử dụng dữ liệu giám sát để tối ưu hóa các triển khai của bạn:
Nếu độ trễ quá cao:
- Kiểm tra số lượng instance (có thể cần thêm)
- Xác minh kích thước model đã phù hợp
- Cân nhắc một khu vực gần hơn
- Kiểm tra kích thước hình ảnh được gửi
Chuyển từ imgsz=1280 sang imgsz=640 để tăng tốc độ lên ~4 lần với mức giảm độ chính xác tối thiểu cho hầu hết các trường hợp sử dụng. Triển khai tới một khu vực gần người dùng của bạn hơn để có độ trễ mạng thấp hơn.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionDữ liệu được lưu trữ trong bao lâu?#
| Kiểu dữ liệu | Lưu trữ |
|---|---|
| Metrics | 30 ngày |
| Logs | 7 ngày |
Link to this sectionTôi có thể thiết lập giám sát bên ngoài không?#
Có, các URL endpoint hoạt động với các công cụ giám sát bên ngoài:
- Giám sát thời gian hoạt động (Pingdom, UptimeRobot)
- Các công cụ APM (Datadog, New Relic)
- Kiểm tra tình trạng tùy chỉnh thông qua endpoint
/health
Link to this sectionCác con số độ trễ chính xác đến mức nào?#
Số liệu độ trễ đo lường:
- P50: Thời gian phản hồi trung bình
- P95: Phân vị thứ 95
- P99: Phân vị thứ 99
Đây là thời gian xử lý phía server, không bao gồm độ trễ mạng đến người dùng của bạn.
Link to this sectionTại sao số liệu của tôi bị trễ?#
Số liệu có độ trễ ~2 phút do:
- Pipeline tổng hợp số liệu
- Các cửa sổ tổng hợp (aggregation windows)
- Caching của bảng điều khiển
Để gỡ lỗi thời gian thực, hãy kiểm tra nhật ký vốn có độ trễ gần như tức thì.
Link to this sectionTôi có thể giám sát nhiều endpoint cùng lúc không?#
Có, trang triển khai hiển thị tất cả các endpoint với các thẻ tổng quan đã được gộp lại. Sử dụng chế độ xem bảng để so sánh hiệu suất giữa các triển khai.