모니터링

Ultralytics Platform은 배포된 엔드포인트에 대한 모니터링을 제공합니다. 자동 폴링을 통해 요청 메트릭을 추적하고, 로그를 확인하며, 상태 정보를 점검하십시오.

Ultralytics Platform Deploy Page Overview Cards And World Map

배포 대시보드

사이드바의 Deploy 페이지는 모든 배포의 모니터링 대시보드 역할을 합니다. 이 페이지는 세계 지도, 개요 메트릭, 배포 관리를 하나의 뷰로 통합합니다. 배포 생성 및 관리에 관한 내용은 Dedicated Endpoints를 참조하십시오.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

개요 카드

페이지 상단의 4개 요약 카드는 다음 정보를 보여줍니다:

Ultralytics Platform Deploy Page Four Overview Cards

지표설명
총 요청 수 (24시간)모든 엔드포인트에 걸친 요청 수
활성 배포현재 실행 중인 엔드포인트
오류율 (24시간)실패한 요청의 비율
P95 지연 시간 (24시간)95 백분위수 응답 시간
오류율 알림

오류율이 5%를 초과하면 오류율 카드가 빨간색으로 강조 표시됩니다. 오류를 진단하려면 개별 배포의 Logs 탭을 확인하십시오.

세계 지도

대화형 세계 지도는 다음을 표시합니다:

  • 사용 가능한 43개 지역 전체에 대한 지역 핀
  • 배포된 지역에 대한 녹색 핀
  • 활성 배포가 진행 중인 지역에 대한 애니메이션 파란색 핀
  • 핀 크기는 배포 상태 및 지연 시간에 따라 달라집니다

Ultralytics Platform Deploy Page World Map With Deployed Regions

배포 목록

개요 카드 아래의 배포 목록에는 프로젝트 전반의 모든 엔드포인트가 표시됩니다. 뷰 모드 토글을 사용하여 다음 모드로 전환할 수 있습니다:

보기설명
카드메트릭, 로그, 코드 및 예측 탭이 포함된 상세 카드
컴팩트(Compact)주요 메트릭이 포함된 소형 카드 그리드 (1-4열)
테이블(Table)정렬 가능한 열(이름, 지역, 상태, 요청 수, P95, 오류)을 갖춘 데이터 테이블
실시간 업데이트

대시보드는 배포 상태 업데이트를 위해 15초마다 폴링을 수행합니다. 배포가 전환 상태(creating, deploying 또는 stopping)인 경우, 폴링은 3초마다 수행됩니다. 메트릭 차트는 60초마다 새로 고쳐집니다. 즉시 업데이트하려면 새로 고침 버튼을 클릭하십시오.

배포별 메트릭

각 배포 카드(카드 뷰)에는 실시간 메트릭이 표시됩니다:

메트릭 행

지표설명
요청 수아이콘과 함께 표시되는 요청 수 (24시간)
P95 지연 시간95 백분위수 응답 시간
오류율실패한 요청의 비율

메트릭은 스파크라인 API 엔드포인트에서 가져오며 60초마다 새로 고쳐집니다.

상태 검사 (Health Check)

실행 중인 배포에는 상태 점검 표시기가 표시됩니다:

표시기의미
녹색 하트정상 — 응답 지연 시간 표시
빨간색 하트비정상 — 오류 메시지 표시
회전하는 아이콘상태 점검 진행 중

상태 점검은 비정상 상태일 때 20초마다 자동 재시도합니다. 새로 고침 아이콘을 클릭하여 수동으로 상태 점검을 트리거할 수 있습니다. 상태 점검은 스케일-투-제로 엔드포인트의 콜드 스타트를 수용하기 위해 55초 타임아웃을 사용합니다.

Ultralytics Platform Deployment Card Health Check Healthy With Latency

콜드 스타트 허용 오차

상태 점검은 스케일-투-제로 엔드포인트의 콜드 스타트(최악의 경우 최대 약 45초)를 고려하여 55초 타임아웃을 사용합니다. 엔드포인트가 준비되면 상태 점검은 밀리초 단위로 완료됩니다.

로그

각 배포 카드에는 최근 로그 항목을 확인할 수 있는 Logs 탭이 포함되어 있습니다:

Ultralytics Platform Deployment Card Logs Tab With Severity Filter

로그 항목

각 로그 항목은 다음을 표시합니다:

필드설명
심각도색상 코딩된 바 (아래 참조)
타임스탬프요청 시간 (로컬 형식)
메시지로그 내용
HTTP 정보상태 코드 및 지연 시간 (해당되는 경우)

필터 버튼을 사용하여 심각도별로 로그를 필터링하십시오:

수준색상설명
DEBUG회색디버그 메시지
INFO파란색일반 요청
WARNING노란색중대하지 않은 문제
ERROR빨간색실패한 요청
CRITICAL짙은 빨간색심각한 장애

UI에는 가장 최근 항목 20개가 표시됩니다. API는 요청당 기본적으로 50개 항목을 제공하며(최대 200개), 이를 지원합니다.

디버깅 워크플로우

오류를 조사할 때: 먼저 Errors를 클릭하여 ERROR 및 WARNING 항목으로 필터링한 다음, 타임스탬프와 HTTP 상태 코드를 검토하십시오. 팀과 공유하려면 로그를 클립보드에 복사하십시오.

코드 예시

각 배포 카드에는 실제 엔드포인트 URL과 API 키가 포함된 즉시 사용 가능한 API 코드를 보여주는 Code 탭이 있습니다:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
자동 채워지는 자격 증명

플랫폼에서 Code 탭을 볼 때 실제 엔드포인트 URL과 API 키가 자동으로 채워집니다. 코드를 복사하여 바로 실행하십시오. 키를 생성하려면 API Keys를 참조하십시오.

배포 예측

각 배포 카드에 있는 Predict 탭은 공유 서비스 대신 배포 엔드포인트를 통해 추론을 실행하는 점을 제외하면 모델의 Predict 탭과 동일한 인터페이스인 인라인 예측 패널을 제공합니다. 이는 브라우저에서 직접 배포된 엔드포인트를 테스트하는 데 유용합니다. 매개변수 세부 정보 및 응답 형식은 Inference를 참조하십시오.

API 엔드포인트

모니터링 개요

GET /api/monitoring

인증된 사용자가 소유한 모든 배포에 대한 집계된 지표를 반환합니다. 선택적 owner 쿼리 매개변수를 통해 워크스페이스를 인식합니다.

배포 지표

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

특정 배포에 대한 스파크라인 데이터 및 요약 지표를 반환합니다. 새로 고침 간격은 60초입니다.

매개변수유형(Type)설명
sparkline불리언(bool)스파크라인 데이터 포함
range문자열시간 범위: 1h, 6h, 24h, 7d 또는 30d

배포 로그

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

선택적 심각도 필터 및 페이지네이션을 포함한 최근 로그 항목을 반환합니다.

매개변수유형(Type)설명
limit정수(int)반환할 최대 항목 수 (기본값: 50, 최대: 200)
severity문자열쉼표로 구분된 심각도 필터
pageToken문자열이전 응답에서 가져온 페이지네이션 토큰

배포 상태

GET /api/deployments/{deploymentId}/health

응답 지연 시간을 포함한 상태 확인 결과를 반환합니다.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

성능 최적화

모니터링 데이터를 사용하여 배포를 최적화하십시오:

지연 시간이 너무 높은 경우:

  1. 인스턴스 수를 확인하십시오 (더 필요할 수 있음)
  2. 모델 크기가 적절한지 확인하십시오
  3. 더 가까운 리전을 고려하십시오
  4. 전송되는 이미지 크기를 확인하십시오
지연 시간 감소

대부분의 사용 사례에서 정확도 손실을 최소화하면서 약 4배의 속도 향상을 위해 imgsz=1280에서 imgsz=640으로 전환하십시오. 네트워크 지연 시간을 줄이려면 사용자에게 더 가까운 리전에 배포하십시오.

FAQ

데이터는 얼마나 오래 보관됩니까?

데이터 유형보관 기간
메트릭 (Metrics)30일
로그7일

외부 모니터링을 설정할 수 있습니까?

예, 엔드포인트 URL은 외부 모니터링 도구와 함께 작동합니다:

  • 가동 시간 모니터링 (Pingdom, UptimeRobot)
  • APM 도구 (Datadog, New Relic)
  • /health 엔드포인트를 통한 사용자 지정 상태 확인

지연 시간 수치는 얼마나 정확합니까?

지연 시간 지표는 다음을 측정합니다:

  • P50: 중앙값 응답 시간
  • P95: 95번째 백분위수
  • P99: 99번째 백분위수

이는 사용자까지의 네트워크 지연 시간을 제외한 서버 측 처리 시간을 나타냅니다.

지표가 지연되는 이유는 무엇입니까?

지표는 다음으로 인해 약 2분 정도 지연됩니다:

  • 지표 집계 파이프라인
  • 집계 윈도우
  • 대시보드 캐싱

실시간 디버깅을 위해서는 거의 즉시 확인 가능한 로그를 확인하십시오.

여러 엔드포인트를 함께 모니터링할 수 있습니까?

예, 배포 페이지에는 집계된 개요 카드가 포함된 모든 엔드포인트가 표시됩니다. 테이블 보기를 사용하여 배포 간 성능을 비교하십시오.

댓글