모니터링
Ultralytics 배포된 엔드포인트에 대한 모니터링을 제공합니다. 요청 메트릭을 추적하고, 로그를 확인하며, 자동 폴링을 통해 상태를 점검하세요.

배포 대시보드
에 지정되어 있습니다. Deploy 사이드바의 이 페이지는 모든 배포에 대한 모니터링 대시보드 역할을 합니다. 세계 지도, 개요 메트릭, 배포 관리를 하나의 화면에 통합합니다. 참조 전용 엔드포인트 배포를 생성하고 관리하기 위한.
graph TB
subgraph Dashboard
Map[World Map] --- Cards[Overview Cards]
Cards --- List[Deployments List]
end
subgraph "Per Deployment"
Metrics[Metrics Row]
Health[Health Check]
Logs[Logs Tab]
Code[Code Tab]
Predict[Predict Tab]
end
List --> Metrics
List --> Health
List --> Logs
List --> Code
List --> Predict
style Dashboard fill:#f5f5f5,color:#333
style Map fill:#2196F3,color:#fff
style Cards fill:#FF9800,color:#fff
style List fill:#4CAF50,color:#fff
개요 카드
페이지 상단의 네 개의 요약 카드에는 다음과 같은 내용이 표시됩니다:

| 지표 | 설명 |
|---|---|
| 총 요청 수 (24시간) | 모든 엔드포인트에 걸친 요청 |
| 활성 배포 | 현재 실행 중인 엔드포인트 |
| 오류율 (24시간) | 실패한 요청의 비율 |
| P95 지연 시간 (24시간) | 95번째 백분위 응답 시간 |
오류율 경고
오류율 카드는 오류율이 5%를 초과할 때 빨간색으로 강조 표시됩니다. 확인하십시오. Logs 개별 배포에서 탭을 눌러 오류를 진단합니다.
세계 지도
대화형 세계 지도는 다음을 보여줍니다:
- 사용 가능한 43개 지역 모두를 위한 지역 핀
- 배포된 리전에 대한 녹색 핀
- 진행 중인 활성 배포가 있는 지역에 대한 애니메이션된 파란색 핀
- 핀 크기는 배포 상태 및 지연 시간에 따라 달라집니다

배포 목록
개요 카드 아래의 배포 목록에는 프로젝트 전반의 모든 엔드포인트가 표시됩니다. 보기 모드 토글을 사용하여 다음을 전환하세요:
| 보기 | 설명 |
|---|---|
| 카드 | 메트릭, 로그, 코드 및 예측 탭이 포함된 상세 정보 카드 |
| 콤팩트 | 주요 지표가 포함된 소형 카드 그리드 (1~4열) |
| 테이블 | 정렬 가능한 열을 가진 데이터테이블: 이름, 지역, 상태, 요청, P95, 오류 |
실시간 업데이트
대시보드는 30초마다 메트릭 업데이트를 확인합니다. 배포가 전환 상태(생성 중, 배포 중)일 때는 확인 간격이 3초로 단축됩니다. 즉시 업데이트하려면 새로 고침 버튼을 클릭하세요.
배포별 메트릭스
각 배포 카드(카드 보기)에는 실시간 메트릭이 표시됩니다:
메트릭스 행
| 지표 | 설명 |
|---|---|
| 요청 | 아이콘이 있는 요청 수 (24시간) |
| P95 지연 시간 | 95번째 백분위 응답 시간 |
| 오류율 | 실패한 요청의 비율 |
메트릭은 스파크라인 API 엔드포인트에서 가져오며 60초마다 새로 고침됩니다.
상태 점검
실행 중인 배포에는 상태 점검 표시기가 나타납니다:
| 지표 | 의미 |
|---|---|
| 녹색 심장 | 건강함 — 응답 지연 시간 표시 |
| 빨간 하트 | 비정상적 — 오류 메시지 표시 |
| 회전 아이콘 | 건강 검진 진행 중 |
건강 상태가 양호하지 않을 경우 20초마다 자동 재시도됩니다. 수동으로 건강 상태 확인을 실행하려면 새로 고침 아이콘을 클릭하세요. 건강 상태 확인은 스케일 투 제로(scale-to-zero) 엔드포인트의 콜드 스타트(cold start)를 수용하기 위해 55초의 타임아웃을 사용합니다.

콜드 스타트 내성
헬스 체크는 스케일-투-제로 엔드포인트의 콜드 스타트(최악의 경우 최대 ~45초)를 고려하여 55초의 타임아웃을 사용합니다. 엔드포인트가 워밍업되면 헬스 체크는 밀리초 단위로 완료됩니다.
로그
각 배치 카드에는 다음이 포함됩니다. Logs 최근 로그 항목을 확인하기 위한 탭:

로그 항목
각 로그 항목은 다음을 보여줍니다:
| 필드 | 설명 |
|---|---|
| 심각도 | 색상 구분 막대 (아래 참조) |
| 타임스탬프 | 요청 시간 (현지 시간 형식) |
| 메시지 | 로그 내용 |
| HTTP 정보 | 상태 코드 및 지연 시간 (해당되는 경우) |
필터 버튼을 사용하여 심각도별로 로그를 필터링하세요:
| 수준 | 색상 | 설명 |
|---|---|---|
| 디버그 | 회색 | 디버그 메시지 |
| INFO | 파란색 | 정상 요청 |
| 경고 | 노란색 | 치명적이지 않은 문제 |
| 오류 | 빨간색 | 실패한 요청 |
| 중요 | 진한 빨강 | 중대한 결함 |
| 통제 | 설명 |
|---|---|
| 오류 | 오류 및 경고 항목으로 필터링 |
| 모든 | 모든 로그 항목 표시 |
| 복사 | 보이는 모든 로그를 클립보드에 복사 |
| 새로 고침 | 로그 항목 재로드 |
UI에는 최근 20개의 항목이 표시됩니다. API는 요청당 기본값으로 50개 항목(최대 200개)을 반환합니다.
디버깅 워크플로
오류 조사 시: 먼저 '오류'를 클릭하여 오류 및 경고 항목으로 필터링한 후, 타임스탬프와 HTTP 상태 코드를 검토하세요. 팀과 공유하기 위해 로그를 클립보드에 복사하세요.
코드 예시
각 배치 카드에는 다음이 포함됩니다. Code 실제 엔드포인트 URL과 API 키가 포함된 즉시 사용 가능한 API 코드를 보여주는 탭:
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
자동 채워진 자격 증명
볼 때 Code 플랫폼의 탭에서 실제 엔드포인트 URL과 API 키가 자동으로 채워집니다. 코드를 복사하여 직접 실행하세요. 참조 API 키 키를 생성하다.
배포 예측
에 지정되어 있습니다. Predict 각 배포 카드의 탭에는 인라인 예측 패널이 제공됩니다 — 모델의 인터페이스와 동일한 Predict 탭을 사용하지만, 공유 서비스 대신 배포 엔드포인트를 통해 추론을 실행합니다. 이는 브라우저에서 직접 배포된 엔드포인트를 테스트하는 데 유용합니다. 참조: 추론 매개변수 세부 정보 및 응답 형식에 대해.
API 엔드포인트
모니터링 개요
GET /api/monitoring
인증된 사용자가 소유한 모든 배포에 대한 집계된 메트릭을 반환합니다. 선택적 owner 쿼리 매개변수.
배포 지표
GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h
특정 배포에 대한 스파크라인 데이터 및 요약 지표를 반환합니다. 새로 고침 간격: 60초.
| 파라미터 | 유형 | 설명 |
|---|---|---|
sparkline | bool | 스파크라인 데이터 포함 |
range | 문자열 | 시간 범위: 1h, 6h, 24h, 7d또는 30d |
배포 로그
GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING
최근 로그 항목을 반환하며, 선택적 심각도 필터 및 페이지 분할을 지원합니다.
| 파라미터 | 유형 | 설명 |
|---|---|---|
limit | 정수 | 반환할 최대 항목 수 (기본값: 50, 최대값: 200) |
severity | 문자열 | 쉼표로 구분된 심각도 필터 |
pageToken | 문자열 | 이전 응답의 페이지 매김 토큰 |
배포 상태
GET /api/deployments/{deploymentId}/health
응답 지연 시간과 함께 상태 확인 결과를 반환합니다.
{
"healthy": true,
"status": 200,
"latencyMs": 142
}
성능 최적화
모니터링 데이터를 활용하여 배포를 최적화하십시오:
지연 시간이 너무 높은 경우:
- 인스턴스 개수 확인 (추가 필요할 수 있음)
- 모델 크기가 적절한지 확인
- 더 가까운 지역을 고려하십시오
- 전송되는 이미지 크기 확인
지연 시간 감소
~에서 ~로 전환 imgsz=1280 에서 imgsz=640 대부분의 사용 사례에서 정확도 손실을 최소화하면서 약 4배의 속도 향상을 제공합니다. 네트워크 지연 시간을 줄이려면 사용자에게 더 가까운 리전에 배포하세요.
오류가 발생하는 경우:
- 오류 로그를 검토하십시오.
Logs탭 - 요청 형식 확인 (멀티파트 양식 필수)
- API 키 유효성 확인
- 속도 제한 확인
용량 한도에 도달하는 경우:
- 여러 지역 고려
- 요청 배치 최적화
- CPU 메모리 리소스 증가
FAQ
데이터는 얼마나 오래 보관되나요?
| 데이터 유형 | 데이터 보존 기간 |
|---|---|
| 메트릭 | 30일 |
| 로그 | 7일 |
외부 모니터링을 설정할 수 있나요?
예, 엔드포인트 URL은 외부 모니터링 도구와 연동됩니다:
- 가동 시간 모니터링 (Pingdom, UptimeRobot)
- APM 도구 (Datadog, New Relic)
- 사용자 정의 건강 상태 점검을 통해
/health종단점
지연 시간 수치는 얼마나 정확한가요?
지연 시간 측정 항목:
- P50: 중앙 응답 시간
- P95: 95번째 백분위수
- P99: 99번째 백분위수
이는 사용자에게 도달하는 네트워크 지연 시간을 포함하지 않고 서버 측 처리 시간을 나타냅니다.
내 지표가 지연되는 이유는 무엇인가요?
측정 항목은 다음으로 인해 약 2분 지연됩니다:
- 측정 항목 집계 파이프라인
- 집계 기간
- 대시보드 캐싱
실시간 디버깅을 위해서는 거의 즉각적으로 업데이트되는 로그를 확인하십시오.
여러 엔드포인트를 함께 모니터링할 수 있나요?
예, 배포 페이지에는 집계된 개요 카드가 포함된 모든 엔드포인트가 표시됩니다. 테이블 보기를 사용하여 배포 간 성능을 비교하세요.