Meet YOLO26: next-gen vision AI.

Link to this sectionGiám sát#

Ultralytics Platform cung cấp tính năng giám sát cho các endpoint đã triển khai. Theo dõi các số liệu yêu cầu, xem nhật ký và kiểm tra trạng thái hoạt động với cơ chế tự động thăm dò (polling).

Ultralytics Platform Deploy Page Overview Cards And World Map

Link to this sectionBảng điều khiển triển khai#

Trang Deploy ở thanh bên đóng vai trò là bảng điều khiển giám sát cho tất cả các bản triển khai của bạn. Trang này kết hợp bản đồ thế giới, số liệu tổng quan và quản lý triển khai trong một chế độ xem duy nhất. Xem Dedicated Endpoints để biết cách tạo và quản lý các bản triển khai.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

Link to this sectionThẻ tổng quan#

Bốn thẻ tóm tắt ở đầu trang hiển thị:

Ultralytics Platform Deploy Page Four Overview Cards

Chỉ sốMô tả
Tổng số yêu cầu (24h)Số lượng yêu cầu trên tất cả các endpoint
Triển khai đang hoạt độngCác endpoint đang chạy hiện tại
Tỷ lệ lỗi (24h)Phần trăm các yêu cầu thất bại
Độ trễ P95 (24h)Thời gian phản hồi ở phân vị thứ 95
Cảnh báo tỷ lệ lỗi

Thẻ tỷ lệ lỗi sẽ sáng lên màu đỏ khi tỷ lệ này vượt quá 5%. Hãy kiểm tra tab Logs trên từng bản triển khai để chẩn đoán lỗi.

Link to this sectionBản đồ thế giới#

Bản đồ tương tác thế giới hiển thị:

  • Ghim vùng cho tất cả 43 vùng khả dụng
  • Ghim màu xanh lá cho các vùng đã triển khai
  • Ghim xanh dương động cho các vùng đang có triển khai thực thi
  • Kích thước ghim thay đổi dựa trên trạng thái triển khai và độ trễ

Ultralytics Platform Deploy Page World Map With Deployed Regions

Link to this sectionDanh sách triển khai#

Bên dưới các thẻ tổng quan, danh sách triển khai hiển thị tất cả các endpoint trong các dự án của bạn. Sử dụng nút chuyển chế độ xem để thay đổi giữa:

XemMô tả
CardsThẻ chi tiết đầy đủ với các tab số liệu, nhật ký, mã nguồn và dự đoán
CompactLưới các thẻ nhỏ (1-4 cột) với các số liệu chính
TableDataTable với các cột có thể sắp xếp: Tên, Vùng, Trạng thái, Yêu cầu, P95, Lỗi
Cập nhật thời gian thực

Bảng điều khiển tự động thăm dò mỗi 15 giây để cập nhật trạng thái triển khai. Khi các bản triển khai ở trạng thái chuyển tiếp (creating, deploying hoặc stopping), tần suất thăm dò sẽ tăng lên mỗi 3 giây. Biểu đồ số liệu làm mới sau mỗi 60 giây. Nhấp vào nút làm mới để cập nhật ngay lập tức.

Link to this sectionSố liệu theo từng bản triển khai#

Mỗi thẻ triển khai (trong chế độ xem thẻ) hiển thị số liệu thời gian thực:

Link to this sectionHàng số liệu#

Chỉ sốMô tả
Yêu cầuSố lượng yêu cầu (24h) kèm biểu tượng
Độ trễ P95Thời gian phản hồi ở phân vị thứ 95
Tỷ lệ lỗiPhần trăm các yêu cầu thất bại

Các số liệu được lấy từ endpoint API sparkline và làm mới mỗi 60 giây.

Link to this sectionKiểm tra tình trạng#

Các bản triển khai đang chạy hiển thị chỉ báo kiểm tra sức khỏe:

Chỉ báoÝ nghĩa
Trái tim màu xanh láKhỏe mạnh — hiển thị độ trễ phản hồi
Trái tim màu đỏKhông khỏe mạnh — hiển thị thông báo lỗi
Biểu tượng xoay vòngĐang thực hiện kiểm tra sức khỏe

Các đợt kiểm tra sức khỏe sẽ tự động thử lại sau mỗi 20 giây khi ở trạng thái không khỏe mạnh. Nhấp vào biểu tượng làm mới để kích hoạt kiểm tra sức khỏe thủ công. Quá trình kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để thích ứng với các trạng thái khởi động lạnh (cold start) trên các endpoint mở rộng về 0.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

Khả năng chịu đựng khởi động lạnh

Việc kiểm tra sức khỏe sử dụng thời gian chờ 55 giây để tính đến các trường hợp khởi động lạnh trên các endpoint mở rộng về 0 (tối đa ~45 giây trong trường hợp xấu nhất). Sau khi endpoint đã sẵn sàng, các đợt kiểm tra sức khỏe sẽ hoàn tất trong vài mili giây.

Link to this sectionNhật ký#

Mỗi thẻ triển khai bao gồm tab Logs để xem các mục nhật ký gần đây:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

Link to this sectionMục nhật ký#

Mỗi mục nhật ký hiển thị:

Trường (Field)Mô tả
Mức độ nghiêm trọngThanh mã màu (xem bên dưới)
Dấu thời gianThời gian yêu cầu (định dạng địa phương)
Thông điệpNội dung nhật ký
Thông tin HTTPMã trạng thái và độ trễ (nếu có)

Lọc nhật ký theo mức độ nghiêm trọng bằng cách sử dụng các nút lọc:

Mức độMàu sắcMô tả
DEBUGXámCác thông điệp gỡ lỗi
INFOXanh dươngCác yêu cầu bình thường
WARNINGVàngCác vấn đề không nghiêm trọng
ERRORĐỏCác yêu cầu thất bại
CRITICALĐỏ sẫmCác lỗi nghiêm trọng

Giao diện hiển thị 20 mục gần nhất. API mặc định cung cấp 50 mục mỗi yêu cầu (tối đa 200).

Quy trình gỡ lỗi

Khi điều tra lỗi: trước tiên hãy nhấp vào Errors để lọc các mục ERROR và WARNING, sau đó xem xét dấu thời gian và mã trạng thái HTTP. Sao chép nhật ký vào bảng tạm để chia sẻ với nhóm của bạn.

Link to this sectionVí dụ mã nguồn#

Mỗi thẻ triển khai bao gồm tab Code hiển thị mã API sẵn sàng sử dụng với URL endpoint thực tế và API key của bạn:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
Thông tin xác thực tự động điền

Khi xem tab Code trên nền tảng, URL endpoint và API key thực tế của bạn sẽ được tự động điền vào. Sao chép mã nguồn và chạy trực tiếp. Xem API Keys để tạo khóa.

Link to this sectionSuy luận triển khai#

Tab Predict trên mỗi thẻ triển khai cung cấp bảng dự đoán nội dòng — cùng giao diện với tab Predict của model, nhưng thực hiện inference thông qua endpoint triển khai thay vì dịch vụ dùng chung. Điều này hữu ích cho việc kiểm thử một endpoint đã triển khai trực tiếp từ trình duyệt. Xem Inference để biết chi tiết tham số và định dạng phản hồi.

Link to this sectionCác API Endpoints#

Link to this sectionTổng quan về giám sát#

GET /api/monitoring

Trả về các số liệu tổng hợp cho tất cả các triển khai thuộc sở hữu của người dùng đã xác thực. Nhận biết không gian làm việc (workspace) thông qua tham số truy vấn owner tùy chọn.

Link to this sectionSố liệu triển khai#

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

Trả về dữ liệu biểu đồ sparkline và các số liệu tóm tắt cho một triển khai cụ thể. Khoảng thời gian làm mới: 60 giây.

Tham sốLoạiMô tả
sparklineboolBao gồm dữ liệu sparkline
rangestringPhạm vi thời gian: 1h, 6h, 24h, 7d, hoặc 30d

Link to this sectionNhật ký triển khai#

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

Trả về các mục nhật ký gần đây với bộ lọc mức độ nghiêm trọng tùy chọn và phân trang.

Tham sốLoạiMô tả
limitintSố mục tối đa được trả về (mặc định: 50, tối đa: 200)
severitystringBộ lọc mức độ nghiêm trọng phân tách bằng dấu phẩy
pageTokenstringToken phân trang từ phản hồi trước đó

Link to this sectionTình trạng triển khai#

GET /api/deployments/{deploymentId}/health

Trả về trạng thái kiểm tra tình trạng (health check) cùng với độ trễ phản hồi.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142,
    "serverTiming": { "db": 8, "ping": 142, "total": 150 }
}

Link to this sectionTối ưu hóa hiệu suất#

Sử dụng dữ liệu giám sát để tối ưu hóa các triển khai của bạn:

Nếu độ trễ quá cao:

  1. Kiểm tra số lượng instance (có thể cần thêm)
  2. Xác minh kích thước model đã phù hợp
  3. Cân nhắc một khu vực gần hơn
  4. Kiểm tra kích thước hình ảnh được gửi
Giảm độ trễ

Chuyển từ imgsz=1280 sang imgsz=640 để tăng tốc độ lên ~4 lần với mức giảm độ chính xác tối thiểu cho hầu hết các trường hợp sử dụng. Triển khai tới một khu vực gần người dùng của bạn hơn để có độ trễ mạng thấp hơn.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionDữ liệu được lưu trữ trong bao lâu?#

Kiểu dữ liệuLưu trữ
Metrics30 ngày
Logs7 ngày

Link to this sectionTôi có thể thiết lập giám sát bên ngoài không?#

Có, các URL endpoint hoạt động với các công cụ giám sát bên ngoài:

  • Giám sát thời gian hoạt động (Pingdom, UptimeRobot)
  • Các công cụ APM (Datadog, New Relic)
  • Kiểm tra tình trạng tùy chỉnh thông qua endpoint /health

Link to this sectionCác con số độ trễ chính xác đến mức nào?#

Số liệu độ trễ đo lường:

  • P50: Thời gian phản hồi trung bình
  • P95: Phân vị thứ 95
  • P99: Phân vị thứ 99

Đây là thời gian xử lý phía server, không bao gồm độ trễ mạng đến người dùng của bạn.

Link to this sectionTại sao số liệu của tôi bị trễ?#

Số liệu có độ trễ ~2 phút do:

  • Pipeline tổng hợp số liệu
  • Các cửa sổ tổng hợp (aggregation windows)
  • Caching của bảng điều khiển

Để gỡ lỗi thời gian thực, hãy kiểm tra nhật ký vốn có độ trễ gần như tức thì.

Link to this sectionTôi có thể giám sát nhiều endpoint cùng lúc không?#

Có, trang triển khai hiển thị tất cả các endpoint với các thẻ tổng quan đã được gộp lại. Sử dụng chế độ xem bảng để so sánh hiệu suất giữa các triển khai.

Bình luận