배포
Ultralytics YOLO 실제 운영 환경에 적용하기 위한 포괄적인 배포 옵션을 제공합니다. 추론 API로 모델을 테스트하고, 전용 엔드포인트에 배포하며, 실시간으로 성능을 모니터링할 수 있습니다.
개요
배포 섹션은 다음을 지원합니다:
- 테스트 모델을 브라우저에서 직접 실행
- 43개 글로벌 리전의 전용 엔드포인트에 배포
- 요청 메트릭 및 로그 모니터링
- 트래픽에 따라 자동으로 확장
배포 옵션
Ultralytics 다양한 배포 경로를 제공합니다:
| 옵션 | 설명 | 최적의 |
|---|---|---|
| 테스트 탭 | 브라우저 기반 추론 테스트 | 개발, 검증 |
| 공유 API | 다중 테넌트 추론 서비스 | 경량 사용, 테스트 |
| 전용 엔드포인트 | 단일 테넌트 생산 서비스 | 생산, 낮은 지연 시간 |
워크플로우
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| 무대 | 설명 |
|---|---|
| 테스트 | 샘플 이미지로 모델 검증하기 |
| 구성 | 지역 및 크기 조정 옵션 선택 |
| 배포 | 전용 엔드포인트 생성 |
| 모니터 | 요청, 지연 시간 및 오류 추적 |
아키텍처
공유된 추론
공유 추론 서비스는 3개의 주요 지역에서 운영됩니다:
| 지역 | 위치 |
|---|---|
| 미국 | 미국 중부(아이오와) |
| EU | EU 서부 (벨기에) |
| AP | 아시아 태평양 (홍콩) |
요청은 자동으로 귀하의 데이터 지역으로 라우팅됩니다.
전용 엔드포인트
전 세계 43개 지역에 배포:
- 아메리카: 15개 지역
- 유럽: 12개 지역
- 아시아 태평양: 16개 지역
각 엔드포인트는 단일 테넌트 서비스로 다음과 같은 기능을 제공합니다:
- 전용 컴퓨팅 리소스
- 자동 확장(0-N 인스턴스)
- 사용자 지정 URL
- 독립적 모니터링
주요 기능
글로벌 커버리지
사용자와 가까운 곳에 배포하세요. 43개 지역을 커버합니다:
- 북아메리카, 남아메리카
- 유럽, 중동, 아프리카
- 아시아 태평양, 오세아니아
자동 확장
엔드포인트는 자동으로 확장됩니다:
- 제로 스케일: 유휴 시 비용 없음
- 확장: 트래픽 급증 처리
- 구성 가능한 제한: 최소/최대 인스턴스 설정
저지연
전용 엔드포인트는 다음을 제공합니다:
- 콜드 스타트: 약 2~5초
- 따뜻한 추론: 50-200ms (모델에 따라 다름)
- 최적 성능을 위한 지역별 라우팅
빠른 링크
FAQ
공유 추론과 전용 추론의 차이점은 무엇인가요?
| 기능 | 공유됨 | 헌신적인 |
|---|---|---|
| 지연 시간 | 변수 | 일관된 |
| 비용 | 요청당 지불 | 가동 시간에 대한 비용 지불 |
| 규모 | 한정 | 구성 가능 |
| 지역 | 3 | 43 |
| URL | 일반적인 | 사용자 정의 |
배포에는 얼마나 걸리나요?
전용 엔드포인트 배포는 일반적으로 1~2분이 소요됩니다:
- 이미지 가져오기 (~30초)
- 컨테이너 시작 (~30초)
- 건강 상태 확인 (~30초)
여러 모델을 배포할 수 있나요?
예, 각 모델은 서로 다른 리전에 여러 개의 엔드포인트를 가질 수 있습니다. 총 엔드포인트 수에는 제한이 없습니다(요금제에 따라 다름).
엔드포인트가 유휴 상태일 때 어떤 일이 발생하나요?
스케일-투-제로 활성화 시:
- 엔드포인트는 비활성 상태 후 스케일 다운됩니다
- 첫 번째 요청이 콜드 스타트를 유발합니다
- 후속 요청은 빠릅니다
콜드 스타트를 방지하려면 최소 인스턴스를 0보다 크게 설정하십시오.
📅 생성 0 일 전 ✏️ 업데이트 0일 전