콘텐츠로 건너뛰기

모니터링

Ultralytics 배포된 엔드포인트에 대한 모니터링을 제공합니다. 요청 메트릭을 추적하고, 로그를 확인하며, 자동 폴링을 통해 상태를 점검하세요.

Ultralytics 배포 페이지 개요 카드 및 세계 지도

배포 대시보드

에 지정되어 있습니다. Deploy 사이드바의 이 페이지는 모든 배포에 대한 모니터링 대시보드 역할을 합니다. 세계 지도, 개요 메트릭, 배포 관리를 하나의 화면에 통합합니다. 참조 전용 엔드포인트 배포를 생성하고 관리하기 위한.

graph TB
    subgraph Dashboard
        Map[World Map] --- Cards[Overview Cards]
        Cards --- List[Deployments List]
    end
    subgraph "Per Deployment"
        Metrics[Metrics Row]
        Health[Health Check]
        Logs[Logs Tab]
        Code[Code Tab]
        Predict[Predict Tab]
    end
    List --> Metrics
    List --> Health
    List --> Logs
    List --> Code
    List --> Predict

    style Dashboard fill:#f5f5f5,color:#333
    style Map fill:#2196F3,color:#fff
    style Cards fill:#FF9800,color:#fff
    style List fill:#4CAF50,color:#fff

개요 카드

페이지 상단의 네 개의 요약 카드에는 다음과 같은 내용이 표시됩니다:

Ultralytics 배포 페이지 4 개요 카드

지표설명
총 요청 수 (24시간)모든 엔드포인트에 걸친 요청
활성 배포현재 실행 중인 엔드포인트
오류율 (24시간)실패한 요청의 비율
P95 지연 시간 (24시간)95번째 백분위 응답 시간

오류율 경고

오류율 카드는 오류율이 5%를 초과할 때 빨간색으로 강조 표시됩니다. 확인하십시오. Logs 개별 배포에서 탭을 눌러 오류를 진단합니다.

세계 지도

대화형 세계 지도는 다음을 보여줍니다:

  • 사용 가능한 43개 지역 모두를 위한 지역 핀
  • 배포된 리전에 대한 녹색 핀
  • 진행 중인 활성 배포가 있는 지역에 대한 애니메이션된 파란색 핀
  • 핀 크기는 배포 상태 및 지연 시간에 따라 달라집니다

Ultralytics 배포 페이지 배포된 지역이 표시된 세계 지도

배포 목록

개요 카드 아래의 배포 목록에는 프로젝트 전반의 모든 엔드포인트가 표시됩니다. 보기 모드 토글을 사용하여 다음을 전환하세요:

보기설명
카드메트릭, 로그, 코드 및 예측 탭이 포함된 상세 정보 카드
콤팩트주요 지표가 포함된 소형 카드 그리드 (1~4열)
테이블정렬 가능한 열을 가진 데이터테이블: 이름, 지역, 상태, 요청, P95, 오류

실시간 업데이트

대시보드는 30초마다 메트릭 업데이트를 확인합니다. 배포가 전환 상태(생성 중, 배포 중)일 때는 확인 간격이 3초로 단축됩니다. 즉시 업데이트하려면 새로 고침 버튼을 클릭하세요.

배포별 메트릭스

각 배포 카드(카드 보기)에는 실시간 메트릭이 표시됩니다:

메트릭스 행

지표설명
요청아이콘이 있는 요청 수 (24시간)
P95 지연 시간95번째 백분위 응답 시간
오류율실패한 요청의 비율

메트릭은 스파크라인 API 엔드포인트에서 가져오며 60초마다 새로 고침됩니다.

상태 점검

실행 중인 배포에는 상태 점검 표시기가 나타납니다:

지표의미
녹색 심장건강함 — 응답 지연 시간 표시
빨간 하트비정상적 — 오류 메시지 표시
회전 아이콘건강 검진 진행 중

건강 상태가 양호하지 않을 경우 20초마다 자동 재시도됩니다. 수동으로 건강 상태 확인을 실행하려면 새로 고침 아이콘을 클릭하세요. 건강 상태 확인은 스케일 투 제로(scale-to-zero) 엔드포인트의 콜드 스타트(cold start)를 수용하기 위해 55초의 타임아웃을 사용합니다.

Ultralytics 배포 카드 상태 점검 정상 (지연 시간 발생)

콜드 스타트 내성

헬스 체크는 스케일-투-제로 엔드포인트의 콜드 스타트(최악의 경우 최대 ~45초)를 고려하여 55초의 타임아웃을 사용합니다. 엔드포인트가 워밍업되면 헬스 체크는 밀리초 단위로 완료됩니다.

로그

각 배치 카드에는 다음이 포함됩니다. Logs 최근 로그 항목을 확인하기 위한 탭:

Ultralytics 배포 카드 로그 탭 (중요도 필터 적용)

로그 항목

각 로그 항목은 다음을 보여줍니다:

필드설명
심각도색상 구분 막대 (아래 참조)
타임스탬프요청 시간 (현지 시간 형식)
메시지로그 내용
HTTP 정보상태 코드 및 지연 시간 (해당되는 경우)

필터 버튼을 사용하여 심각도별로 로그를 필터링하세요:

수준색상설명
디버그회색디버그 메시지
INFO파란색정상 요청
경고노란색치명적이지 않은 문제
오류빨간색실패한 요청
중요진한 빨강중대한 결함
통제설명
오류오류 및 경고 항목으로 필터링
모든모든 로그 항목 표시
복사보이는 모든 로그를 클립보드에 복사
새로 고침로그 항목 재로드

UI에는 최근 20개의 항목이 표시됩니다. API는 요청당 기본값으로 50개 항목(최대 200개)을 반환합니다.

디버깅 워크플로

오류 조사 시: 먼저 '오류'를 클릭하여 오류 및 경고 항목으로 필터링한 후, 타임스탬프와 HTTP 상태 코드를 검토하세요. 팀과 공유하기 위해 로그를 클립보드에 복사하세요.

코드 예시

각 배치 카드에는 다음이 포함됩니다. Code 실제 엔드포인트 URL과 API 키가 포함된 즉시 사용 가능한 API 코드를 보여주는 탭:

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
# Send image for inference
curl -X POST "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

자동 채워진 자격 증명

볼 때 Code 플랫폼의 탭에서 실제 엔드포인트 URL과 API 키가 자동으로 채워집니다. 코드를 복사하여 직접 실행하세요. 참조 API 키 키를 생성하다.

배포 예측

에 지정되어 있습니다. Predict 각 배포 카드의 탭에는 인라인 예측 패널이 제공됩니다 — 모델의 인터페이스와 동일한 Predict 탭을 사용하지만, 공유 서비스 대신 배포 엔드포인트를 통해 추론을 실행합니다. 이는 브라우저에서 직접 배포된 엔드포인트를 테스트하는 데 유용합니다. 참조: 추론 매개변수 세부 정보 및 응답 형식에 대해.

API 엔드포인트

모니터링 개요

GET /api/monitoring

인증된 사용자가 소유한 모든 배포에 대한 집계된 메트릭을 반환합니다. 선택적 owner 쿼리 매개변수.

배포 지표

GET /api/deployments/{deploymentId}/metrics?sparkline=true&range=24h

특정 배포에 대한 스파크라인 데이터 및 요약 지표를 반환합니다. 새로 고침 간격: 60초.

파라미터유형설명
sparklinebool스파크라인 데이터 포함
range문자열시간 범위: 1h, 6h, 24h, 7d또는 30d

배포 로그

GET /api/deployments/{deploymentId}/logs?limit=50&severity=ERROR,WARNING

최근 로그 항목을 반환하며, 선택적 심각도 필터 및 페이지 분할을 지원합니다.

파라미터유형설명
limit정수반환할 최대 항목 수 (기본값: 50, 최대값: 200)
severity문자열쉼표로 구분된 심각도 필터
pageToken문자열이전 응답의 페이지 매김 토큰

배포 상태

GET /api/deployments/{deploymentId}/health

응답 지연 시간과 함께 상태 확인 결과를 반환합니다.

{
    "healthy": true,
    "status": 200,
    "latencyMs": 142
}

성능 최적화

모니터링 데이터를 활용하여 배포를 최적화하십시오:

지연 시간이 너무 높은 경우:

  1. 인스턴스 개수 확인 (추가 필요할 수 있음)
  2. 모델 크기가 적절한지 확인
  3. 더 가까운 지역을 고려하십시오
  4. 전송되는 이미지 크기 확인

지연 시간 감소

~에서 ~로 전환 imgsz=1280 에서 imgsz=640 대부분의 사용 사례에서 정확도 손실을 최소화하면서 약 4배의 속도 향상을 제공합니다. 네트워크 지연 시간을 줄이려면 사용자에게 더 가까운 리전에 배포하세요.

오류가 발생하는 경우:

  1. 오류 로그를 검토하십시오. Logs
  2. 요청 형식 확인 (멀티파트 양식 필수)
  3. API 키 유효성 확인
  4. 속도 제한 확인

용량 한도에 도달하는 경우:

  1. 여러 지역 고려
  2. 요청 배치 최적화
  3. CPU 메모리 리소스 증가

FAQ

데이터는 얼마나 오래 보관되나요?

데이터 유형데이터 보존 기간
메트릭30일
로그7일

외부 모니터링을 설정할 수 있나요?

예, 엔드포인트 URL은 외부 모니터링 도구와 연동됩니다:

  • 가동 시간 모니터링 (Pingdom, UptimeRobot)
  • APM 도구 (Datadog, New Relic)
  • 사용자 정의 건강 상태 점검을 통해 /health 종단점

지연 시간 수치는 얼마나 정확한가요?

지연 시간 측정 항목:

  • P50: 중앙 응답 시간
  • P95: 95번째 백분위수
  • P99: 99번째 백분위수

이는 사용자에게 도달하는 네트워크 지연 시간을 포함하지 않고 서버 측 처리 시간을 나타냅니다.

내 지표가 지연되는 이유는 무엇인가요?

측정 항목은 다음으로 인해 약 2분 지연됩니다:

  • 측정 항목 집계 파이프라인
  • 집계 기간
  • 대시보드 캐싱

실시간 디버깅을 위해서는 거의 즉각적으로 업데이트되는 로그를 확인하십시오.

여러 엔드포인트를 함께 모니터링할 수 있나요?

예, 배포 페이지에는 집계된 개요 카드가 포함된 모든 엔드포인트가 표시됩니다. 테이블 보기를 사용하여 배포 간 성능을 비교하세요.



5; 1 전에 생성됨 ✏️ 5 전에 업데이트됨
glenn-jochersergiuwaxmann

댓글