Link to this section모니터링#
Ultralytics Platform은 배포된 엔드포인트에 대한 모니터링을 제공합니다. 자동 폴링을 통해 요청 메트릭을 추적하고 로그를 확인하며 상태를 점검할 수 있습니다.

Link to this section배포 대시보드#
사이드바의 Deploy 페이지는 모든 배포를 위한 모니터링 대시보드 역할을 합니다. 이 페이지는 세계 지도, 개요 메트릭, 배포 관리를 하나의 화면에 통합하여 보여줍니다. 배포 생성 및 관리에 대한 내용은 Dedicated Endpoints를 참조하십시오.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fffLink to this section개요 카드#
페이지 상단에 있는 4개의 요약 카드는 다음 정보를 표시합니다:

| 지표 | 설명 |
|---|---|
| 총 요청 수(24시간) | 모든 엔드포인트에 걸친 요청 수 |
| 활성 배포 | 현재 실행 중인 엔드포인트 |
| 오류율(24시간) | 실패한 요청의 비율 |
| P95 지연 시간(24시간) | 95번째 백분위수 응답 시간 |
오류율이 5%를 초과하면 오류율 카드가 빨간색으로 강조 표시됩니다. 개별 배포의 Logs 탭을 확인하여 오류를 진단하십시오.
Link to this section세계 지도#
대화형 세계 지도는 다음 정보를 보여줍니다:
- 지역 핀: 사용 가능한 43개 모든 지역
- 녹색 핀: 배포된 지역
- 애니메이션 파란색 핀: 배포가 진행 중인 활성 지역
- 핀 크기: 배포 상태 및 지연 시간에 따라 다름

Link to this section배포 목록#
개요 카드 아래의 배포 목록에는 프로젝트 전반의 모든 엔드포인트가 표시됩니다. 보기 모드 토글을 사용하여 다음 모드로 전환할 수 있습니다:
| 보기 | 설명 |
|---|---|
| 카드 | 메트릭, 로그, 코드 및 예측 탭이 포함된 전체 상세 카드 |
| 컴팩트 | 주요 메트릭이 포함된 작은 카드 그리드(1~4열) |
| 테이블 | 정렬 가능한 열이 있는 데이터 테이블: 이름, 지역, 상태, 요청 수, P95, 오류 |
대시보드는 15초마다 배포 상태 업데이트를 폴링합니다. 배포가 전환 상태(creating, deploying 또는 stopping)인 경우 폴링 간격은 3초로 단축됩니다. 메트릭 차트는 60초마다 새로 고쳐집니다. 즉시 업데이트하려면 새로 고침 버튼을 클릭하십시오.
Link to this section배포별 메트릭#
각 배포 카드(카드 보기 모드)는 실시간 메트릭을 보여줍니다:
Link to this section메트릭 행#
| 지표 | 설명 |
|---|---|
| 요청 수 | 아이콘과 함께 표시되는 요청 횟수(24시간) |
| P95 지연 시간 | 95번째 백분위수 응답 시간 |
| 오류율 | 실패한 요청의 비율 |
메트릭은 스파크라인 API 엔드포인트에서 가져오며 60초마다 새로 고쳐집니다.
Link to this section상태 확인#
실행 중인 배포에는 상태 점검 표시기가 나타납니다:
| 표시기 | 의미 |
|---|---|
| 녹색 하트 | 정상 — 응답 지연 시간 표시 |
| 빨간색 하트 | 비정상 — 오류 메시지 표시 |
| 회전하는 아이콘 | 상태 점검 진행 중 |
상태 점검은 비정상 상태일 때 20초마다 자동 재시도됩니다. 새로 고침 아이콘을 클릭하여 수동으로 상태 점검을 트리거할 수 있습니다. 상태 점검은 scale-to-zero 엔드포인트의 콜드 스타트를 수용하기 위해 55초의 제한 시간을 사용합니다.

상태 점검은 scale-to-zero 엔드포인트의 콜드 스타트(최악의 경우 최대 약 45초)를 고려하여 55초의 제한 시간을 사용합니다. 엔드포인트가 준비되면 상태 점검은 밀리초 단위로 완료됩니다.
Link to this section로그#
각 배포 카드에는 최근 로그 항목을 볼 수 있는 Logs 탭이 포함되어 있습니다:

Link to this section로그 항목#
각 로그 항목은 다음을 보여줍니다:
| 필드 | 설명 |
|---|---|
| 심각도 | 색상 코딩된 막대(아래 참조) |
| 타임스탬프 | 요청 시간(현지 형식) |
| 메시지 | 로그 콘텐츠 |
| HTTP 정보 | 상태 코드 및 지연 시간(해당하는 경우) |
필터 버튼을 사용하여 심각도별로 로그를 필터링하십시오:
| 수준 | 색상 | 설명 |
|---|---|---|
| DEBUG | 회색 | 디버그 메시지 |
| INFO | 파란색 | 일반 요청 |
| WARNING | 노란색 | 중요하지 않은 문제 |
| ERROR | 빨간색 | 실패한 요청 |
| CRITICAL | 짙은 빨간색 | 치명적인 오류 |
UI에는 최근 항목 20개가 표시됩니다. API는 요청당 기본적으로 50개 항목을 제공하며 최대 200개까지 가능합니다.
오류를 조사할 때: 먼저 Errors를 클릭하여 ERROR 및 WARNING 항목으로 필터링한 다음 타임스탬프와 HTTP 상태 코드를 검토하십시오. 로그를 클립보드에 복사하여 팀과 공유할 수 있습니다.
Link to this section코드 예제#
각 배포 카드에는 실제 엔드포인트 URL 및 API 키가 포함된 즉시 사용 가능한 API 코드를 보여주는 Code 탭이 있습니다:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())플랫폼에서 Code 탭을 볼 때, 실제 엔드포인트 URL과 API 키가 자동으로 채워집니다. 코드를 복사하여 즉시 실행하십시오. 키 생성 방법은 API Keys를 참조하십시오.
Link to this section배포 모델 예측#
각 배포 카드에 있는 Predict 탭은 인라인 예측 패널을 제공합니다. 이는 모델의 Predict 탭과 동일한 인터페이스이지만, 공유 서비스 대신 배포 엔드포인트를 통해 추론을 실행합니다. 이는 브라우저에서 직접 배포된 엔드포인트를 테스트할 때 유용합니다. 매개변수 세부 정보 및 응답 형식은 Inference를 참조하십시오.
Link to this sectionAPI 엔드포인트#
Link to this section모니터링 개요#
GET /api/monitoring인증된 사용자가 소유한 모든 배포에 대한 집계된 메트릭을 반환합니다. 선택적 owner 쿼리 매개변수를 통해 워크스페이스를 인식합니다.
Link to this section배포 메트릭#
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h특정 배포에 대한 스파크라인 데이터 및 요약 메트릭을 반환합니다. 새로 고침 간격: 60초.
| 파라미터 | 유형 | 설명 |
|---|---|---|
sparkline | bool | 스파크라인 데이터 포함 |
range | 문자열(string) | 시간 범위: 1h, 6h, 24h, 7d 또는 30d |
Link to this section배포 로그#
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING선택적 심각도 필터 및 페이지네이션을 포함하여 최근 로그 항목을 반환합니다.
| 파라미터 | 유형 | 설명 |
|---|---|---|
limit | 정수(int) | 반환할 최대 항목 수 (기본값: 50, 최대값: 200) |
severity | 문자열(string) | 쉼표로 구분된 심각도 필터 |
pageToken | 문자열(string) | 이전 응답에서 가져온 페이지네이션 토큰 |
Link to this section배포 상태#
GET /api/deployments/{deploymentId}/health응답 지연 시간과 함께 상태 확인 결과를 반환합니다.
{
"healthy": true,
"status": 200,
"latencyMs": 142,
"serverTiming": { "db": 8, "ping": 142, "total": 150 }
}Link to this section성능 최적화#
모니터링 데이터를 사용하여 배포를 최적화하십시오:
지연 시간이 너무 높을 경우:
- 인스턴스 수 확인 (더 필요할 수 있음)
- 모델 크기가 적절한지 확인
- 더 가까운 리전 고려
- 전송 중인 이미지 크기 확인
imgsz=1280에서 imgsz=640으로 전환하면 대부분의 사용 사례에서 정확도 손실을 최소화하면서 약 4배의 속도 향상을 얻을 수 있습니다. 네트워크 지연 시간을 줄이려면 사용자에게 더 가까운 리전에 배포하십시오.
Link to this sectionFAQ#
Link to this section데이터는 얼마나 오래 보관됩니까?#
| 데이터 유형 | 보관 기간 |
|---|---|
| Metrics | 30일 |
| 로그 | 7일 |
Link to this section외부 모니터링을 설정할 수 있습니까?#
네, 엔드포인트 URL은 외부 모니터링 도구와 함께 작동합니다:
- 가동 시간 모니터링 (Pingdom, UptimeRobot)
- APM 도구 (Datadog, New Relic)
/health엔드포인트를 통한 사용자 지정 상태 확인
Link to this section지연 시간 수치는 얼마나 정확합니까?#
지연 시간 메트릭 측정 항목:
- P50: 중앙값 응답 시간
- P95: 95번째 백분위수
- P99: 99번째 백분위수
이는 사용자까지의 네트워크 지연 시간을 제외한 서버 측 처리 시간을 나타냅니다.
Link to this section메트릭이 지연되는 이유는 무엇입니까?#
메트릭은 다음과 같은 이유로 약 2분 정도 지연됩니다:
- 메트릭 집계 파이프라인
- 집계 윈도우
- 대시보드 캐싱
실시간 디버깅을 하려면 즉각적인 확인이 가능한 로그를 확인하십시오.
Link to this section여러 엔드포인트를 함께 모니터링할 수 있습니까?#
네, 배포 페이지에는 모든 엔드포인트가 집계된 개요 카드로 표시됩니다. 테이블 뷰를 사용하여 배포 간 성능을 비교하십시오.