배포

Ultralytics Platform은 YOLO 모델을 프로덕션 환경에 배포하기 위한 포괄적인 배포 옵션을 제공합니다. 브라우저 기반 추론으로 모델을 테스트하고, 전 세계 43개 지역의 전용 엔드포인트에 배포하며, 성능을 실시간으로 모니터링하십시오.



Watch: Get Started with Ultralytics Platform - Deploy

개요

배포 섹션에서 다음과 같은 작업을 수행할 수 있습니다:

  • Predict 탭을 사용하여 브라우저에서 직접 모델 테스트
  • 전 세계 43개 지역의 전용 엔드포인트에 배포
  • 요청 메트릭, 로그 및 상태 확인 모니터링
  • 유휴 상태일 때 0으로 확장(Scale to zero) (현재 배포는 하나의 활성 인스턴스를 실행합니다)

Ultralytics Platform 배포 페이지 세계 지도 및 개요 카드

배포 옵션

Ultralytics Platform은 다양한 배포 경로를 제공합니다:

옵션설명용도
Predict 탭이미지, 웹캠 및 예제를 활용한 브라우저 기반 추론개발, 검증
공유 추론(Shared Inference)3개 지역에 걸친 멀티 테넌트 서비스가벼운 사용량, 테스트
전용 엔드포인트43개 지역에 걸친 싱글 테넌트 서비스프로덕션, 낮은 지연 시간

워크플로우

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
단계설명
TestPredict으로 모델 검증
구성지역 및 배포 이름 선택 (배포 시 고정된 기본 리소스가 사용됩니다)
배포(Deploy)Deploy에서 전용 엔드포인트 생성
모니터링모니터링에서 요청, 지연 시간, 오류 및 로그 추적

아키텍처

공유 추론

공유 추론 서비스는 3개의 주요 지역에서 실행되며, 데이터 지역에 따라 자동으로 요청을 라우팅합니다:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
영역위치
미국미국 아이오와주
유럽유럽 벨기에
AP아시아 태평양 대만

전용 엔드포인트

Ultralytics Cloud를 통해 전 세계 43개 지역에 배포하십시오:

  • 미주: 14개 지역
  • 유럽: 13개 지역
  • 아시아 태평양: 12개 지역
  • 중동 및 아프리카: 4개 지역

각 엔드포인트는 다음과 같은 특징을 가진 싱글 테넌트 서비스입니다:

  • 기본 리소스: 1 CPU, 2 GiB 메모리, minInstances=0, maxInstances=1
  • 유휴 상태 시 0으로 확장(Scale-to-zero)
  • 고유 엔드포인트 URL
  • 독립적인 모니터링, 로그 및 상태 확인

배포 페이지

사이드바의 Deploy 아래에서 글로벌 배포 페이지에 액세스하십시오. 이 페이지는 다음을 표시합니다:

  • 세계 지도: 배포된 지역 핀 표시 (인터랙티브 지도)
  • 개요 카드: 총 요청 수(24시간), 활성 배포, 오류율(24시간), P95 지연 시간(24시간)
  • 배포 목록: 카드, 컴팩트, 테이블의 3가지 보기 모드
  • 새 배포 버튼: 완료된 모델에서 엔드포인트를 생성하는 버튼

Ultralytics Platform 배포 페이지 개요 카드 및 배포 목록

자동 폴링

페이지는 일반적으로 15초마다 폴링합니다. 배포가 전환 상태(creating, deploying, stopping)에 있을 때는 더 빠른 피드백을 위해 폴링 간격이 3초로 단축됩니다.

주요 특징

글로벌 커버리지

43개 지역을 통해 사용자 근처에 배포하십시오:

  • 북미, 남미
  • 유럽, 중동, 아프리카
  • 아시아 태평양, 오세아니아

확장 동작

엔드포인트는 현재 다음과 같이 작동합니다:

  • 0으로 확장(Scale to zero): 유휴 상태일 때 비용 발생 없음 (기본값)
  • 단일 활성 인스턴스: 현재 모든 플랜에서 maxInstances1로 제한됩니다
비용 절감

0으로 확장 기능이 기본적으로 활성화되어 있습니다(최소 인스턴스 = 0). 활성 추론 시간에 대해서만 비용을 지불합니다.

낮은 지연 시간

전용 엔드포인트 제공 사항:

  • 콜드 스타트: ~5-15초 (캐시된 컨테이너), 최대 ~45초 (최초 배포 시)
  • 웜 추론: 50-200ms (모델에 따라 다름)
  • 최적의 성능을 위한 지역별 라우팅

상태 확인

각 실행 중인 배포에는 다음을 포함한 자동 상태 확인이 포함됩니다:

  • 실시간 상태 표시기 (정상/비정상)
  • 응답 지연 시간 표시
  • 비정상 시 자동 재시도 (20초마다 폴링)
  • 수동 새로고침 버튼

빠른 시작

2분 이내에 모델 배포:

  1. 모델을 프로젝트에 학습 또는 업로드
  2. 모델의 Deploy 탭으로 이동
  3. 지연 시간 테이블에서 지역 선택
  4. Deploy 클릭 — 엔드포인트가 즉시 활성화됩니다
빠른 배포
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

배포가 완료되면 엔드포인트 URL과 API 키를 사용하여 모든 애플리케이션에서 추론 요청을 보낼 수 있습니다.

빠른 링크

FAQ

공유 추론과 전용 추론의 차이점은 무엇인가요?

기능공유전담
지연 시간가변적일관됨
비용무료 (포함됨)무료 (기본), 사용량 기반 (고급)
규모제한적0으로 확장(Scale-to-zero), 단일 인스턴스
지역33개
URL공용사용자 정의 모델(Custom)
요청 속도분당 20회 요청무제한

배포에 걸리는 시간은 얼마인가요?

전용 엔드포인트 배포는 일반적으로 1-2분이 소요됩니다:

  1. 이미지 풀 (~30초)
  2. 컨테이너 시작 (~30초)
  3. 상태 확인 (~30초)

여러 모델을 배포할 수 있습니까?

네, 각 모델은 서로 다른 지역에 여러 엔드포인트를 가질 수 있습니다. 배포 횟수는 플랜에 따라 제한됩니다: Free 3, Pro 10, Enterprise unlimited.

엔드포인트가 유휴 상태일 때는 어떻게 됩니까?

스케일 투 제로(scale-to-zero)가 활성화된 경우:

  • 비활성 상태가 되면 엔드포인트가 축소됩니다
  • 첫 번째 요청이 콜드 스타트를 유발합니다
  • 이후 요청은 빠르게 처리됩니다

유휴 기간 이후의 첫 번째 요청은 콜드 스타트를 유발합니다.

댓글