콘텐츠로 건너뛰기

배포

Ultralytics YOLO 실제 운영 환경에 적용하기 위한 포괄적인 배포 옵션을 제공합니다. 추론 API로 모델을 테스트하고, 전용 엔드포인트에 배포하며, 실시간으로 성능을 모니터링할 수 있습니다.

개요

배포 섹션은 다음을 지원합니다:

  • 테스트 모델을 브라우저에서 직접 실행
  • 43개 글로벌 리전의 전용 엔드포인트에 배포
  • 요청 메트릭 및 로그 모니터링
  • 트래픽에 따라 자동으로 확장

배포 옵션

Ultralytics 다양한 배포 경로를 제공합니다:

옵션설명최적의
테스트 탭브라우저 기반 추론 테스트개발, 검증
공유 API다중 테넌트 추론 서비스경량 사용, 테스트
전용 엔드포인트단일 테넌트 생산 서비스생산, 낮은 지연 시간

워크플로우

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
무대설명
테스트샘플 이미지로 모델 검증하기
구성지역 및 크기 조정 옵션 선택
배포전용 엔드포인트 생성
모니터요청, 지연 시간 및 오류 추적

아키텍처

공유된 추론

공유 추론 서비스는 3개의 주요 지역에서 운영됩니다:

지역위치
미국미국 중부(아이오와)
EUEU 서부 (벨기에)
AP아시아 태평양 (홍콩)

요청은 자동으로 귀하의 데이터 지역으로 라우팅됩니다.

전용 엔드포인트

전 세계 43개 지역에 배포:

  • 아메리카: 15개 지역
  • 유럽: 12개 지역
  • 아시아 태평양: 16개 지역

각 엔드포인트는 단일 테넌트 서비스로 다음과 같은 기능을 제공합니다:

  • 전용 컴퓨팅 리소스
  • 자동 확장(0-N 인스턴스)
  • 사용자 지정 URL
  • 독립적 모니터링

주요 기능

글로벌 커버리지

사용자와 가까운 곳에 배포하세요. 43개 지역을 커버합니다:

  • 북아메리카, 남아메리카
  • 유럽, 중동, 아프리카
  • 아시아 태평양, 오세아니아

자동 확장

엔드포인트는 자동으로 확장됩니다:

  • 제로 스케일: 유휴 시 비용 없음
  • 확장: 트래픽 급증 처리
  • 구성 가능한 제한: 최소/최대 인스턴스 설정

저지연

전용 엔드포인트는 다음을 제공합니다:

  • 콜드 스타트: 약 2~5초
  • 따뜻한 추론: 50-200ms (모델에 따라 다름)
  • 최적 성능을 위한 지역별 라우팅

FAQ

공유 추론과 전용 추론의 차이점은 무엇인가요?

기능공유됨헌신적인
지연 시간변수일관된
비용요청당 지불가동 시간에 대한 비용 지불
규모한정구성 가능
지역343
URL일반적인사용자 정의

배포에는 얼마나 걸리나요?

전용 엔드포인트 배포는 일반적으로 1~2분이 소요됩니다:

  1. 이미지 가져오기 (~30초)
  2. 컨테이너 시작 (~30초)
  3. 건강 상태 확인 (~30초)

여러 모델을 배포할 수 있나요?

예, 각 모델은 서로 다른 리전에 여러 개의 엔드포인트를 가질 수 있습니다. 총 엔드포인트 수에는 제한이 없습니다(요금제에 따라 다름).

엔드포인트가 유휴 상태일 때 어떤 일이 발생하나요?

스케일-투-제로 활성화 시:

  • 엔드포인트는 비활성 상태 후 스케일 다운됩니다
  • 첫 번째 요청이 콜드 스타트를 유발합니다
  • 후속 요청은 빠릅니다

콜드 스타트를 방지하려면 최소 인스턴스를 0보다 크게 설정하십시오.



📅 생성 0 일 전 ✏️ 업데이트 0일 전
glenn-jocher

댓글