Link to this section전용 엔드포인트#
Ultralytics Platform은 전 세계 43개 지역의 전용 엔드포인트에 YOLO 모델을 배포할 수 있도록 지원합니다. 각 엔드포인트는 규모에 따라 0으로 자동 조정(scale-to-zero)되는 싱글 테넌트 서비스이며, 고유한 엔드포인트 URL과 독립적인 모니터링 기능을 제공합니다.

Link to this section엔드포인트 생성#
Link to this section배포(Deploy) 탭에서 생성#
모델의 Deploy 탭에서 모델을 배포합니다:
- 모델로 이동합니다
- Deploy 탭을 클릭합니다.
- 대화형 세계 지도에서 지역을 선택합니다. 지역은 현재 위치로부터의 지연 시간(latency)에 따라 녹색에서 빨간색으로 그라데이션 표시됩니다(더 빠른 지역은 녹색에 가깝고, 더 느린 지역은 빨간색에 가깝습니다).
- 지역 행에서 Deploy를 클릭합니다.
배포 이름은 모델 이름과 지역 도시를 기반으로 자동 생성됩니다(예: yolo26n-iowa).
Link to this section배포(Deployments) 페이지에서 생성#
사이드바의 전역 Deploy 페이지에서 배포를 생성합니다:
- New Deployment를 클릭합니다.
- 모델 선택기에서 모델을 선택합니다.
- 지도 또는 표에서 지역을 선택합니다.
- 자동 생성된 배포 이름(수정 가능)과 기본 리소스를 검토합니다.
- Deploy Model을 클릭합니다.

Link to this section배포 수명 주기#
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteLink to this section리전 선택#
전 세계 43개 지역 중에서 선택하십시오. 대화형 지역 지도와 표는 다음 정보를 보여줍니다:
- 지역 핀(Region pins): 지연 시간에 따라 녹색에서 빨간색으로 그라데이션 색상이 지정됩니다(빠를수록 녹색, 느릴수록 빨간색).
- 배포된 지역(Deployed regions): "Deployed" 배지로 강조 표시됩니다.
- 배포 중인 지역(Deploying regions): 애니메이션 펄스 표시기가 나타납니다.
- 양방향 강조(Bidirectional highlighting): 지도에 마우스를 올리면 표의 행이 강조 표시되며, 그 반대의 경우도 동일합니다.

모델 Deploy 탭의 지역 표에는 다음 항목이 포함됩니다:
| 열 | 설명 |
|---|---|
| 위치(Location) | 국기 아이콘이 포함된 도시 및 국가 |
| 영역(Zone) | 지역 식별자 |
| 지연 시간 | 측정된 핑(ping) 시간(3회 핑의 중간값) |
| 거리(Distance) | 사용자 위치로부터의 거리(km 단위) |
| 작업(Actions) | 배포 버튼 또는 "Deployed" 상태 배지 |
The New Deployment dialog (from the global Deploy page) shows a simpler region table with only Location, Latency, and Select columns.
지연 시간을 최소화하려면 사용자에게 가장 가까운 지역을 선택하십시오. Rescan 버튼을 사용하여 현재 위치에서의 지연 시간을 다시 측정할 수 있습니다.
Link to this section사용 가능한 지역#
| 영역 | 위치 |
|---|---|
| us-central1 | 미국 아이오와주 |
| us-east1 | 미국 사우스캐롤라이나 |
| us-east4 | 미국 북부 버지니아 |
| us-east5 | 미국 콜럼버스 |
| us-south1 | 미국 댈러스 |
| us-west1 | 미국 오리건 |
| us-west2 | 미국 로스앤젤레스 |
| us-west3 | 미국 솔트레이크시티 |
| us-west4 | 미국 라스베이거스 |
| northamerica-northeast1 | 캐나다 몬트리올 |
| northamerica-northeast2 | 캐나다 토론토 |
| northamerica-south1 | 멕시코 케레타로 |
| southamerica-east1 | 브라질 상파울루 |
| southamerica-west1 | 칠레 산티아고 |
Link to this section엔드포인트 구성#
Link to this section새 배포 대화 상자#
New Deployment 대화 상자에서 제공하는 항목은 다음과 같습니다.
| 설정 | 설명 | 기본값 |
|---|---|---|
| 모델 | 완료된 모델 중에서 선택 | - |
| 리전 | 배포 리전 | - |
| 배포 이름 | 자동 생성, 수정 가능 | - |
| CPU 코어 | 고정 기본값 | 1 |
| 메모리 (GB) | 고정 기본값 | 2 |

배포는 1 CPU, 2 GiB 메모리, minInstances = 0, maxInstances = 1의 고정 기본값을 사용합니다. 유휴 상태일 때는 0으로 스케일링되므로 활성 추론 시간에 대해서만 요금이 부과됩니다.
배포 이름은 모델 이름과 리전 도시에서 자동으로 생성됩니다(예: yolo26n-iowa). 동일한 모델을 동일한 리전에 다시 배포하면 숫자 접미사가 추가됩니다(예: yolo26n-iowa-2).
Link to this section배포 탭 (빠른 배포)#
모델의 Deploy 탭에서 배포할 때, 엔드포인트는 기본 리소스(1 CPU, 2 GB 메모리)와 스케일-투-제로(scale-to-zero) 기능이 활성화된 상태로 생성됩니다. 배포 이름은 자동으로 생성됩니다.
Link to this section엔드포인트 관리#
Link to this section보기 모드#
배포 목록은 다음 세 가지 보기 모드를 지원합니다:
| 모드 | 설명 |
|---|---|
| 카드 | 로그, 코드 예제, 예측 패널이 포함된 상세 카드 보기 |
| 컴팩트 | 주요 지표가 포함된 작은 카드 그리드 보기 |
| 테이블 | 정렬 가능한 열과 검색 기능을 갖춘 데이터 테이블 보기 |

Link to this section배포 카드 (카드 보기)#
카드 보기에 있는 각 배포 카드는 다음 정보를 표시합니다:
- 헤더: 이름, 리전 플래그, 상태 배지, 시작/중지/삭제 버튼
- 엔드포인트 URL: API 문서 링크가 포함된 복사 가능한 URL
- 지표: 요청 수(24시간), P95 지연 시간, 오류율
- 상태 점검: 지연 시간과 수동 새로 고침 기능을 갖춘 실시간 상태 표시기
- 탭:
Logs,Code,Predict
Logs 탭은 심각도 필터링(전체/오류)이 포함된 최근 로그 항목을 보여줍니다. Code 탭은 실제 엔드포인트 URL 및 API 키가 포함된 Python, JavaScript, cURL 형식의 즉시 사용 가능한 코드 예제를 제공합니다. Predict 탭은 배포 환경에서 직접 테스트할 수 있는 인라인 예측 패널을 제공합니다.
Link to this section배포 상태#
| 상태 | 설명 |
|---|---|
| 생성 중(Creating) | 배포가 설정되는 중입니다 |
| 배포 중(Deploying) | 컨테이너가 시작되는 중입니다 |
| 준비 완료(Ready) | 엔드포인트가 활성화되어 요청을 수락하고 있습니다 |
| 중지 중(Stopping) | 엔드포인트가 종료되는 중입니다 |
| 중지됨(Stopped) | 엔드포인트가 일시 중지되었습니다(요금 미부과) |
| 실패함(Failed) | 배포 실패(오류 메시지 참조) |
Link to this section엔드포인트 URL#
각 엔드포인트는 다음과 같은 고유한 URL을 가집니다:
https://predict-abc123.run.app

복사 버튼을 클릭하여 URL을 복사하십시오. 문서 아이콘을 클릭하여 해당 엔드포인트에 대해 자동 생성된 API 문서를 확인하십시오.
Link to this section수명 주기 관리#
엔드포인트 상태 제어:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| 작업 | 설명 |
|---|---|
| 시작 | 중지된 엔드포인트 다시 시작 |
| 중지 | 엔드포인트 일시 중지(요금 미부과) |
| Delete | 엔드포인트 영구 삭제 |
Link to this section엔드포인트 중지#
요금 부과를 일시 중지하려면 엔드포인트를 중지하십시오:
- 배포 카드에서 일시 중지 아이콘을 클릭하십시오
- 엔드포인트 상태가 "중지 중"에서 "중지됨"으로 변경됩니다
중지된 엔드포인트:
- 요청을 수락하지 않음
- 비용이 발생하지 않음
- 언제든지 다시 시작 가능
Link to this section엔드포인트 삭제#
엔드포인트를 영구적으로 제거하려면:
- 배포 카드에서 삭제(휴지통) 아이콘을 클릭하십시오
- 대화 상자에서 삭제를 확인하십시오
삭제는 즉시 영구적으로 수행됩니다. 언제든지 새로운 엔드포인트를 생성할 수 있습니다.
Link to this section엔드포인트 사용#
Link to this section인증#
각 배포는 귀하 계정의 API 키와 함께 생성됩니다. 요청 시 이를 포함하십시오:
Authorization: Bearer YOUR_API_KEYAPI 키 접두사는 식별을 위해 배포 카드 하단에 표시됩니다. API Keys에서 키를 생성하십시오.
Link to this section속도 제한 없음#
전용 엔드포인트 URL로 직접 전송되는 요청은 Platform API 속도 제한의 적용을 받지 않습니다. 처리량은 엔드포인트의 CPU, 메모리 및 스케일링 구성에 의해서만 제한됩니다. (브라우저 내 테스터와 같이 Platform API를 통해 프록시되는 요청은 여전히 표준 20회/분 예측 제한을 사용합니다.) 이것은 API 키당 20회/분으로 속도가 제한되는 공유 추론에 비해 가진 핵심적인 장점입니다.
Link to this section요청 예시#
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Link to this section요청 파라미터#
| 파라미터 | 유형 | 기본값 | 범위 | 설명 |
|---|---|---|---|---|
file | 파일 | - | - | 이미지 또는 비디오 파일 (필수) |
conf | 부동 소수점(float) | 0.25 | 0.01 – 1.0 | 최소 신뢰도 임계값 |
iou | 부동 소수점(float) | 0.7 | 0.0 – 0.95 | NMS IoU 임계값 |
imgsz | 정수(int) | 640 | 32 – 1280 | 입력 이미지 크기 (픽셀 단위) |
normalize | bool | false | - | 바운딩 박스 좌표를 0 – 1 범위로 반환 |
decimals | 정수(int) | 5 | 0 – 10 | 좌표 값에 대한 소수점 정밀도 |
source | 문자열(string) | - | - | 이미지 URL 또는 base64 문자열 (file의 대안) |
전용 엔드포인트는 file 매개변수를 통해 이미지와 비디오를 모두 수락합니다.
- 이미지 형식 (최대 100 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- 비디오 형식 (최대 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.
Link to this section응답 형식#
작업별 필드가 포함된 shared inference와 동일합니다.
Link to this section가격#
기본 전용 엔드포인트는 모든 플랜에서 무료입니다. 향후 더 높은 리소스 구성(더 많은 vCPU, 더 많은 메모리, 웜 스타트)에 대해 사용량 기반 요금이 제공될 예정입니다.
- 요청을 받을 때만 엔드포인트가 실행되도록 스케일 투 제로(기본값) 기능을 사용하십시오.
- 트래픽에 적절한 최대 인스턴스 수를 설정하십시오.
- Monitoring 대시보드에서 사용량을 모니터링하십시오.
Link to this sectionFAQ#
Link to this section몇 개의 엔드포인트를 생성할 수 있습니까?#
엔드포인트 제한은 플랜에 따라 다릅니다:
- Free: 최대 3개 배포
- Pro: 최대 10개 배포
- Enterprise: 무제한 배포
각 모델은 플랜 할당량 내에서 여러 지역에 배포할 수 있습니다.
Link to this section배포 후 지역을 변경할 수 있습니까?#
아니요, 지역은 고정되어 있습니다. 지역을 변경하려면 다음을 수행하십시오:
- 기존 엔드포인트 삭제
- 원하는 지역에 새 엔드포인트 생성
Link to this section다중 지역 배포는 어떻게 처리합니까?#
글로벌 커버리지를 위해 다음을 수행하십시오:
- 여러 지역에 배포
- 로드 밸런서 또는 DNS 라우팅 사용
- 사용자를 가장 가까운 엔드포인트로 라우팅
Link to this section콜드 스타트 시간은 어떻게 됩니까?#
콜드 스타트 시간은 모델 크기와 해당 지역에 컨테이너가 이미 캐시되어 있는지 여부에 따라 다릅니다. 일반적인 범위는 다음과 같습니다:
| 시나리오 | 콜드 스타트 |
|---|---|
| 캐시된 컨테이너 | ~5-15초 |
| 첫 배포/지역 | ~15-45초 |
상태 확인은 최악의 콜드 스타트 상황을 수용하기 위해 55초의 타임아웃을 사용합니다.
Link to this section사용자 지정 도메인을 사용할 수 있습니까?#
사용자 지정 도메인 기능은 곧 제공될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.