콘텐츠로 건너뛰기

배포

Ultralytics YOLO 실제 운영 환경에 적용하기 위한 포괄적인 배포 옵션을 제공합니다. 브라우저 기반 추론을 통해 모델을 테스트하고, 전 세계 43개 지역에 걸쳐 전용 엔드포인트에 배포하며, 실시간으로 성능을 모니터링할 수 있습니다.

개요

배포 섹션은 다음을 돕습니다.

  • 테스트 모델을 브라우저에서 직접 Predict
  • 배포: 전 세계 43개 리전의 전용 엔드포인트에 배포
  • 요청 메트릭, 로그 및 상태 점검 모니터링
  • 트래픽에 따라 자동으로 확장 (제로 확장 포함)

Ultralytics 배포 페이지 개요 카드 포함 세계 지도

배포 옵션

Ultralytics 플랫폼은 다양한 배포 경로를 제공합니다:

옵션설명최적 용도
예측 탭이미지, 웹캠 및 예제를 활용한 브라우저 기반 추론개발, 검증
공유 추론3개 지역에 걸친 멀티 테넌트 서비스가벼운 사용, 테스트
전용 엔드포인트43개 지역에 걸친 단일 테넌트 서비스프로덕션, 낮은 지연 시간

워크플로우

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
단계설명
테스트모델을 다음으로 검증하십시오: Predict
구성지역, 리소스 및 배포 이름을 선택하십시오
배포다음에서 전용 엔드포인트 생성 Deploy
모니터링모니터링에서 요청, 지연 시간, 오류 및 로그 추적

아키텍처

공유 추론

공유 추론 서비스는 3개의 주요 지역에서 운영되며, 데이터 지역에 따라 요청을 자동으로 라우팅합니다:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
리전위치
미국아이오와, 미국
유럽벨기에, 유럽
AP홍콩, 아시아 태평양 지역

전용 엔드포인트

전 세계 43개 지역에 Ultralytics Cloud로 배포:

  • 아메리카: 14개 지역
  • 유럽: 13개 지역
  • 아시아 태평양: 12개 지역
  • 중동 및 아프리카: 4개 지역

각 엔드포인트는 다음과 같은 단일 테넌트 서비스입니다:

  • 전용 컴퓨팅 리소스(구성 가능한 CPU 메모리)
  • 자동 확장(유휴 시 제로 확장)
  • 고유한 엔드포인트 URL
  • 독립적인 모니터링, 로그 기록 및 상태 점검

배포 페이지

사이드바에서 글로벌 배포 페이지에 접근하세요. Deploy이 페이지에는 다음이 표시됩니다:

  • 배치된 지역 핀이 표시된 세계 지도 (인터랙티브 지도)
  • 개요 카드: 총 요청 수(24시간), 활성 배포, 오류율(24시간), P95 지연 시간(24시간)
  • 배포 목록은 세 가지 보기 모드를 제공합니다: 카드, 컴팩트, 테이블
  • 완료된 모델로부터 엔드포인트를 생성하는 새 배포 버튼

Ultralytics 배포 페이지 개요 카드 및 배포 목록

자동 폴링

이 페이지는 30초마다 메트릭 업데이트를 확인합니다. 배포가 전환 상태(생성, 배포, 중지)에 있을 때는 거의 즉각적인 피드백을 위해 확인 간격이 2~3초로 단축됩니다.

주요 기능

글로벌 커버리지

다음 43개 리전을 통해 사용자와 가까운 곳에 배포하세요:

  • 북미, 남미
  • 유럽, 중동, 아프리카
  • 아시아 태평양, 오세아니아

자동 스케일링

엔드포인트는 자동으로 스케일링됩니다:

  • 제로 스케일: 유휴 시 비용 없음 (기본값)
  • 확장: 트래픽 급증을 자동으로 처리

비용 절감

스케일-투-제로는 기본적으로 활성화되어 있습니다(최소 인스턴스 = 0). 활성 추론 시간에 대해서만 요금이 부과됩니다.

낮은 지연 시간

전용 엔드포인트는 다음을 제공합니다:

  • 콜드 스타트: ~5-15초 (캐시된 컨테이너), 최대 ~45초 (첫 배포)
  • 웜 추론: 50-200ms (모델에 따라 다름)
  • 최적의 성능을 위한 리전별 라우팅

건강 검진

각 실행 중인 배포에는 다음을 포함한 자동 상태 점검이 포함됩니다:

  • 실시간 상태 표시기 (정상/비정상)
  • 응답 지연 시간 표시
  • 상태 불량 시 자동 재시도 (20초마다 폴링)
  • 수동 새로고침 버튼

빠른 시작

2분 이내에 모델 배포하기:

  1. 모델을 프로젝트에 훈련시키거나 업로드하세요
  2. 모델의 배포 탭으로 이동하세요
  3. 지연 시간 테이블에서 지역을 선택하십시오
  4. 배포를 클릭하세요 — 엔드포인트가 활성화되었습니다

빠른 배포

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

배포 후에는 API 키와 함께 엔드포인트 URL을 사용하여 모든 애플리케이션에서 추론 요청을 전송하십시오.

FAQ

공유 추론과 전용 추론의 차이점은 무엇입니까?

기능공유전용
지연 시간가변적일관적
비용요청당 지불가동 시간당 지불
규모제한적구성 가능
리전343
URL일반적사용자 정의

배포는 얼마나 걸립니까?

전용 엔드포인트 배포는 일반적으로 1-2분 소요됩니다.

  1. 이미지 풀링(약 30초)
  2. 컨테이너 시작(약 30초)
  3. 상태 확인(약 30초)

여러 모델을 배포할 수 있습니까?

예, 각 모델은 다른 지역에 여러 엔드포인트를 가질 수 있습니다. 총 엔드포인트 수에는 제한이 없습니다(요금제에 따라 다름).

엔드포인트가 유휴 상태일 때 어떻게 됩니까?

스케일 투 제로(scale-to-zero) 활성화 시:

  • 비활성 상태 후 엔드포인트 축소
  • 첫 요청 시 콜드 스타트 발생
  • 후속 요청은 빠름

휴지 기간 후 첫 요청은 콜드 스타트를 유발합니다.



5; 1 전에 생성됨 ✏️ 5 전에 업데이트됨
glenn-jochersergiuwaxmann

댓글