전용 엔드포인트
Ultralytics Platform을 통해 YOLO 모델을 전 세계 43개 지역의 전용 엔드포인트에 배포할 수 있습니다. 각 엔드포인트는 사용하지 않을 때 0으로 확장되는(scale-to-zero) 단일 테넌트 서비스이며, 고유한 엔드포인트 URL과 독립적인 모니터링 기능을 제공합니다.

엔드포인트 생성
배포(Deploy) 탭에서
모델의 Deploy 탭에서 모델을 배포합니다:
- 모델로 이동하십시오.
- Deploy 탭을 클릭합니다.
- 대화형 세계 지도에서 지역을 선택합니다. 지역은 현재 위치로부터의 지연 시간(Latency)에 따라 색상으로 구분됩니다(녹색 < 100ms, 노란색 < 200ms, 빨간색 > 200ms).
- 해당 지역 행의 Deploy 버튼을 클릭합니다.
배포 이름은 모델 이름과 지역 도시를 조합하여 자동으로 생성됩니다(예: yolo26n-iowa).
배포(Deployments) 페이지에서
사이드바의 전역 Deploy 페이지에서 배포를 생성합니다:
- New Deployment를 클릭합니다.
- 모델 선택기에서 모델을 선택합니다.
- 지도나 표에서 지역을 선택합니다.
- 자동 생성된 배포 이름(수정 가능)과 기본 리소스를 검토합니다.
- Deploy Model을 클릭합니다.

배포 수명 주기
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete지역 선택
전 세계 43개 지역 중에서 선택하십시오. 대화형 지역 지도와 표는 다음 정보를 보여줍니다:
- 지역 핀: 지연 시간에 따라 색상으로 구분됨(녹색 < 100ms, 노란색 < 200ms, 빨간색 > 200ms)
- 배포된 지역: "Deployed" 배지로 강조 표시됨
- 배포 중인 지역: 애니메이션 펄스 표시기
- 양방향 강조: 지도에서 호버하면 표 행이 강조되며, 그 반대도 동일함

모델 Deploy 탭의 지역 표에는 다음 항목이 포함됩니다:
| 열 | 설명 |
|---|---|
| 위치 | 도시 및 국가(국기 아이콘 포함) |
| 영역 | 지역 식별자 |
| 지연 시간 | 측정된 핑 시간(3회 핑의 중앙값) |
| 거리 | 현재 위치로부터의 거리(km) |
| 작업 | 배포 버튼 또는 "Deployed" 상태 배지 |
New Deployment 대화 상자(전역 Deploy 페이지에서 접근)는 위치, 지연 시간, 선택 열만 포함된 간소화된 지역 표를 보여줍니다.
지연 시간을 최소화하려면 사용자에게 가장 가까운 지역을 선택하십시오. 현재 위치에서 지연 시간을 다시 측정하려면 Rescan 버튼을 사용하십시오.
사용 가능한 지역
| 영역 | 위치 |
|---|---|
| us-central1 | 미국 아이오와주 |
| us-east1 | 미국 사우스캐롤라이나 |
| us-east4 | 미국 북부 버지니아 |
| us-east5 | 미국 콜럼버스 |
| us-south1 | 미국 댈러스 |
| us-west1 | 미국 오리건 |
| us-west2 | 미국 로스앤젤레스 |
| us-west3 | 미국 솔트레이크시티 |
| us-west4 | 미국 라스베이거스 |
| northamerica-northeast1 | 캐나다 몬트리올 |
| northamerica-northeast2 | 캐나다 토론토 |
| northamerica-south1 | 멕시코 케레타로 |
| southamerica-east1 | 브라질 상파울루 |
| southamerica-west1 | 칠레 산티아고 |
엔드포인트 구성
새 배포 대화 상자
New Deployment 대화 상자는 다음을 제공합니다:
| 설정 | 설명 | 기본값(Default) |
|---|---|---|
| 모델 | 완료된 모델 중에서 선택 | - |
| 지역 | 배포 지역 | - |
| 배포 이름 | 자동 생성, 편집 가능 | - |
| CPU 코어 | 고정 기본값 | 1 |
| 메모리 (GB) | 고정 기본값 | 2 |

배포는 1 CPU, 2 GiB 메모리, minInstances = 0, maxInstances = 1의 고정 기본값을 사용합니다. 유휴 상태일 때는 0으로 조정(scale-to-zero)되므로 활성 추론 시간에 대해서만 비용을 지불합니다.
배포 이름은 모델 이름과 지역 도시에서 자동으로 생성됩니다(예: yolo26n-iowa). 동일한 모델을 같은 지역에 다시 배포하면 숫자 접미사가 추가됩니다(예: yolo26n-iowa-2).
배포 탭 (빠른 배포)
모델의 Deploy 탭에서 배포할 때, 엔드포인트는 기본 리소스(1 CPU, 2 GB 메모리)와 0으로 조정(scale-to-zero)이 활성화된 상태로 생성됩니다. 배포 이름은 자동으로 생성됩니다.
엔드포인트 관리
보기 모드
배포 목록은 세 가지 보기 모드를 지원합니다:
| 모드 | 설명 |
|---|---|
| 카드 | 로그, 코드 예제, 예측 패널이 포함된 전체 세부 정보 카드 |
| 컴팩트(Compact) | 핵심 지표가 포함된 작은 카드 격자 |
| 테이블(Table) | 정렬 가능한 열과 검색 기능이 있는 데이터 테이블 |

배포 카드 (카드 보기)
카드 보기의 각 배포 카드는 다음을 표시합니다:
- 헤더: 이름, 지역 국기, 상태 배지, 시작/중지/삭제 버튼
- 엔드포인트 URL: API 문서 링크가 포함된 복사 가능한 URL
- 지표: 요청 수(24시간), P95 지연 시간, 오류율
- 상태 확인: 지연 시간 및 수동 새로 고침이 포함된 실시간 상태 표시기
- 탭:
Logs,Code,Predict
Logs 탭은 심각도 필터링(모두 / 오류)이 포함된 최근 로그 항목을 보여줍니다. Code 탭은 실제 엔드포인트 URL 및 API 키가 포함된 Python, JavaScript, cURL 형태의 바로 사용할 수 있는 코드 예제를 보여줍니다. Predict 탭은 배포에서 직접 테스트할 수 있는 인라인 예측 패널을 제공합니다.
배포 상태
| 상태 | 설명 |
|---|---|
| 생성 중(Creating) | 배포가 설정되는 중입니다 |
| 배포 중(Deploying) | 컨테이너가 시작되는 중입니다 |
| 준비됨(Ready) | 엔드포인트가 활성 상태이며 요청을 수락하고 있습니다 |
| 중지 중(Stopping) | 엔드포인트가 종료되는 중입니다 |
| 중지됨(Stopped) | 엔드포인트가 일시 중지되었습니다(과금 안 됨) |
| Failed(실패함) | 배포 실패(오류 메시지 참조) |
엔드포인트 URL
각 엔드포인트에는 고유한 URL이 있습니다. 예:
https://predict-abc123.run.app

복사 버튼을 클릭하여 URL을 복사하십시오. 문서 아이콘을 클릭하여 엔드포인트에 대해 자동 생성된 API 문서를 확인하십시오.
수명 주기 관리
엔드포인트 상태를 제어하십시오:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| 작업 | 설명 |
|---|---|
| 시작 | 중지된 엔드포인트 재개 |
| 중지 | 엔드포인트 일시 중지(과금 안 됨) |
| 삭제 | 엔드포인트 영구 제거 |
엔드포인트 중지
엔드포인트를 중지하여 과금을 일시 중지합니다:
- 배포 카드에서 일시 중지 아이콘을 클릭하십시오
- 엔드포인트 상태가 "중지 중"으로 변경된 후 "중지됨"으로 바뀝니다
중지된 엔드포인트는:
- 요청을 수락하지 않습니다
- 비용이 발생하지 않습니다
- 언제든지 다시 시작할 수 있습니다
엔드포인트 삭제
엔드포인트를 영구적으로 제거합니다:
- 배포 카드에서 삭제(휴지통) 아이콘을 클릭하십시오
- 대화 상자에서 삭제 확인
삭제는 즉각적이며 영구적입니다. 언제든지 새 엔드포인트를 생성할 수 있습니다.
엔드포인트 사용
인증
각 배포는 귀하의 계정에서 생성된 API 키로 생성됩니다. 요청 시 포함하십시오:
Authorization: Bearer YOUR_API_KEYAPI 키 접두사는 식별을 위해 배포 카드 하단에 표시됩니다. API Keys에서 키를 생성하십시오.
요율 제한 없음
전용 엔드포인트는 Platform API 요율 제한의 적용을 받지 않습니다. 요청이 전용 서비스로 직접 전달되므로 처리량은 엔드포인트의 CPU, 메모리 및 확장 구성에 의해서만 제한됩니다. 이는 API 키당 분당 20회 요청으로 제한되는 공유 추론에 비해 핵심적인 장점입니다.
요청 예시
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())요청 매개변수
| 매개변수 | 유형(Type) | 기본값(Default) | 범위 | 설명 |
|---|---|---|---|---|
file | file | - | - | 이미지 또는 비디오 파일 (필수) |
conf | 부동 소수점 | 0.25 | 0.01 – 1.0 | 최소 신뢰도 임계값 |
iou | 부동 소수점 | 0.7 | 0.0 – 0.95 | NMS IoU 임계값 |
imgsz | int | 640 | 32 – 1280 | 픽셀 단위의 입력 이미지 크기 |
normalize | bool | false | - | 바운딩 박스 좌표를 0 – 1 범위로 반환 |
decimals | int | 5 | 0 – 10 | 좌표 값의 소수점 정밀도 |
source | 문자열 | - | - | 이미지 URL 또는 base64 문자열 (file의 대안) |
전용 엔드포인트는 file 매개변수를 통해 이미지와 비디오를 모두 수락합니다.
- 이미지 형식 (최대 50MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- 비디오 형식 (최대 100MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.
응답 형식
태스크별 필드가 포함된 공유 추론과 동일합니다.
가격 정책
기본 전용 엔드포인트는 모든 플랜에서 무료입니다. 고사양 구성(더 많은 vCPU, 더 많은 메모리, 웜 스타트)은 향후 사용량 기반 가격 정책으로 제공될 예정입니다.
- 요청이 있을 때만 엔드포인트가 실행되도록 제로 스케일링(기본값)을 사용하십시오.
- 트래픽에 적합한 최대 인스턴스 수를 설정하십시오.
- 모니터링 대시보드에서 사용량을 모니터링하십시오.
FAQ
몇 개의 엔드포인트를 생성할 수 있습니까?
엔드포인트 제한은 플랜에 따라 다릅니다:
- Free: 최대 3개 배포
- Pro: 최대 10개 배포
- Enterprise: 무제한 배포
각 모델은 플랜 할당량 내에서 여러 지역에 배포할 수 있습니다.
배포 후 지역을 변경할 수 있습니까?
아니요, 지역은 고정되어 있습니다. 지역을 변경하려면 다음을 수행하십시오:
- 기존 엔드포인트 삭제
- 원하는 지역에 새 엔드포인트 생성
다중 지역 배포는 어떻게 처리합니까?
전 세계적인 커버리지를 위해:
- 여러 지역에 배포
- 로드 밸런서 또는 DNS 라우팅 사용
- 사용자를 가장 가까운 엔드포인트로 라우팅
콜드 스타트 시간은 얼마입니까?
콜드 스타트 시간은 모델 크기와 컨테이너가 해당 지역에 이미 캐시되어 있는지 여부에 따라 다릅니다. 일반적인 범위는 다음과 같습니다:
| 시나리오 | 콜드 스타트 |
|---|---|
| 캐시된 컨테이너 | 약 5-15초 |
| 최초 배포/지역 | 약 15-45초 |
상태 확인은 최악의 콜드 스타트 상황을 수용하기 위해 55초 타임아웃을 사용합니다.
사용자 지정 도메인을 사용할 수 있습니까?
사용자 지정 도메인 기능은 곧 제공될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.