Link to this section배포#
Ultralytics Platform은 YOLO 모델을 프로덕션 환경에 배포하기 위한 포괄적인 배포 옵션을 제공합니다. 브라우저 기반 추론으로 모델을 테스트하고, 43개 글로벌 리전에 걸쳐 전용 엔드포인트를 배포하며, 실시간으로 성능을 모니터링하십시오.
Watch: Get Started with Ultralytics Platform - Deploy
Link to this section개요#
배포 섹션은 다음을 지원합니다:
Predict탭을 사용하여 브라우저에서 직접 모델 테스트- 43개 글로벌 리전에 전용 엔드포인트 배포
- 요청 메트릭, 로그 및 상태 점검 모니터링
- 유휴 상태 시 0으로 스케일링(현재 배포는 단일 활성 인스턴스를 실행합니다)

Link to this section배포 옵션#
Ultralytics Platform은 다수의 배포 경로를 제공합니다:
| 옵션 | 설명 | 최적 대상 |
|---|---|---|
| Predict 탭 | 이미지, 웹캠 및 예제를 사용한 브라우저 기반 추론 | 개발, 검증 |
| 공유 추론(Shared Inference) | 3개 리전에 걸친 멀티 테넌트 서비스 | 가벼운 사용, 테스트 |
| 전용 엔드포인트 | 43개 리전에 걸친 단일 테넌트 서비스 | 프로덕션, 저지연 |
Link to this section워크플로우#
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| 단계 | 설명 |
|---|---|
| Test | Predict 탭에서 모델 검증 |
| 구성 | 리전 및 배포 이름 선택(배포는 고정된 기본 리소스를 사용합니다) |
| 배포 (Deploy) | Deploy 탭에서 전용 엔드포인트 생성 |
| 모니터링 | 모니터링에서 요청, 지연 시간, 오류 및 로그 추적 |
Link to this section아키텍처#
Link to this section공유 추론#
공유 추론 서비스는 3개의 주요 리전에서 실행되며 데이터 리전에 따라 자동으로 요청을 라우팅합니다:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff| 리전 | 위치 |
|---|---|
| 미국(US) | 미국 아이오와주 |
| 유럽(EU) | 유럽 벨기에 |
| 아시아 태평양(AP) | 아시아 태평양, 대만 |
Link to this section전용 엔드포인트#
Ultralytics Cloud를 통해 전 세계 43개 리전에 배포하십시오:
- 아메리카: 14개 리전
- 유럽: 13개 리전
- 아시아 태평양: 12개 리전
- 중동 및 아프리카: 4개 리전
각 엔드포인트는 다음과 같은 기능을 갖춘 단일 테넌트 서비스입니다:
1 CPU,2 GiB메모리,minInstances=0,maxInstances=1의 기본 리소스- 유휴 상태 시 0으로 스케일링
- 고유 엔드포인트 URL
- 독립적인 모니터링, 로그 및 상태 점검
Link to this section배포 페이지#
사이드바의 Deploy 아래에서 글로벌 배포 페이지에 액세스하십시오. 이 페이지는 다음을 보여줍니다:
- 배포된 리전 핀이 표시된 세계 지도(대화형 지도)
- 개요 카드: 총 요청 수(24시간), 활성 배포, 오류율(24시간), P95 지연 시간(24시간)
- 카드, 간소화, 테이블의 세 가지 보기 모드를 지원하는 배포 목록
- 완료된 모든 모델에서 엔드포인트를 생성할 수 있는 새 배포 버튼

이 페이지는 정상 상태에서 15초마다 폴링을 수행합니다. 배포가 전환 상태(creating, deploying 또는 stopping)일 때, 더 빠른 피드백을 위해 폴링 간격이 3초로 단축됩니다.
Link to this section주요 특징#
Link to this section글로벌 커버리지#
다음 43개 리전을 통해 사용자에게 가까운 곳에 배포하십시오:
- 북미, 남미
- 유럽, 중동, 아프리카
- 아시아 태평양, 오세아니아
Link to this section스케일링 동작#
엔드포인트는 현재 다음과 같이 동작합니다:
- 0으로 스케일링: 유휴 상태 시 비용 발생 안 함(기본값)
- 단일 활성 인스턴스: 모든 플랜에서
maxInstances는 현재1로 제한됩니다
0으로 스케일링은 기본적으로 활성화되어 있습니다(최소 인스턴스 = 0). 활성 추론 시간에 대해서만 비용을 지불합니다.
Link to this section저지연#
전용 엔드포인트는 다음을 제공합니다:
- 콜드 스타트: 약 5-15초(캐시된 컨테이너), 최대 약 45초(첫 배포 시)
- 웜 추론: 50-200ms(모델에 따라 다름)
- 최적의 성능을 위한 리전별 라우팅
Link to this section상태 점검#
실행 중인 각 배포에는 다음을 포함하는 자동 상태 점검이 포함됩니다:
- 실시간 상태 표시기(정상/비정상)
- 응답 지연 시간 표시
- 비정상 상태 시 자동 재시도(20초마다 폴링)
- 수동 새로 고침 버튼
Link to this section빠른 시작#
2분 이내에 모델 배포:
- 프로젝트에 모델을 학습하거나 업로드하십시오
- 모델의 Deploy 탭으로 이동하십시오
- 지연 시간 테이블에서 리전을 선택하십시오
- Deploy를 클릭하십시오 — 엔드포인트가 활성화됩니다
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
배포가 완료되면 API 키와 함께 엔드포인트 URL을 사용하여 모든 애플리케이션에서 추론 요청을 보낼 수 있습니다.
Link to this section빠른 링크#
Link to this sectionFAQ#
Link to this section공유 추론과 전용 추론의 차이점은 무엇입니까?#
| 기능 | 공유 | 전용 |
|---|---|---|
| 지연 시간 | 가변적 | 일관적 |
| 비용 | 무료(포함됨) | 무료(기본), 사용량 기반(고급) |
| 스케일 | 제한적 | 0으로 스케일링, 단일 인스턴스 |
| 리전 | 3 | 43 |
| URL | 일반(Generic) | 사용자 지정(Custom) |
| 속도 | 분당 20회 요청 | 플랫폼을 통한 경우 분당 20회 요청, 직접 엔드포인트 URL 사용 시 무제한 |
Link to this section배포에는 얼마나 걸립니까?#
전용 엔드포인트 배포는 일반적으로 1-2분이 소요됩니다:
- 이미지 풀(약 30초)
- 컨테이너 시작(약 30초)
- 상태 확인(약 30초)
Link to this section여러 모델을 배포할 수 있습니까?#
Yes, each model can have multiple endpoints in different regions. Deployment counts are limited by plan: Free 3, Pro 10, Enterprise unlimited.
Link to this section엔드포인트가 유휴 상태일 때는 어떻게 됩니까?#
스케일 투 제로(scale-to-zero)가 활성화된 경우:
- 비활성 상태 후 엔드포인트가 축소됩니다
- 첫 번째 요청이 콜드 스타트를 트리거합니다
- 이후 요청은 빠르게 처리됩니다
유휴 기간 이후의 첫 번째 요청은 콜드 스타트를 트리거합니다.