전용 엔드포인트
Ultralytics Platform은 전 세계 43개 지역의 전용 엔드포인트에 YOLO 모델을 배포할 수 있도록 합니다. 각 엔드포인트는 자동 스케일링, 고유한 엔드포인트 URL 및 독립적인 모니터링을 갖춘 단일 테넌트 서비스입니다.

엔드포인트 생성
배포 탭에서
모델을 다음에서 배포합니다. Deploy 탭:
- 모델로 이동
- 배포 탭을 클릭합니다.
- Select a region from the interactive world map — regions are color-coded by latency from your location (green < 100ms, yellow < 200ms, red > 200ms)
- 지역 행에서 배포를 클릭합니다.
배포 이름은 모델 이름과 지역 도시(예: yolo26n-iowa)입니다.
배포 페이지에서
글로벌에서 배포를 생성합니다. Deploy 사이드바의 페이지:
- 새 배포를 클릭합니다.
- 모델 선택기에서 모델을 선택하십시오
- 지도 또는 표에서 지역을 선택하세요
- 선택적으로 배포 이름 및 리소스를 사용자 정의할 수 있습니다.
- 모델 배포를 클릭합니다.

배포 수명 주기
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
지역 선택
전 세계 43개 리전 중에서 선택하세요. 대화형 리전 맵과 테이블은 다음을 보여줍니다:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- 배포된 지역: "Deployed" 배지로 강조 표시됩니다.
- 배포 중인 지역: 애니메이션 펄스 표시기
- 양방향 하이라이팅: 지도에 마우스를 올리면 테이블 행이 강조 표시되고, 그 반대도 마찬가지입니다.

모델의 지역 테이블 Deploy 탭에는 다음이 포함됩니다:
| 열 | 설명 |
|---|---|
| 위치 | 국기 아이콘이 있는 도시 및 국가 |
| 구역 | 리전 식별자 |
| 지연 시간 | 측정된 핑 시간 (3회 핑의 중앙값) |
| 거리 | 현재 위치로부터의 거리(km) |
| 작업 | 배포 버튼 또는 "배포됨" 상태 배지 |
새 배포 대화 상자
에 지정되어 있습니다. New Deployment 대화 상자 (전역에서 Deploy 페이지)에는 위치, 지연 시간, 선택 열만 포함된 더 간단한 지역 테이블이 표시됩니다.
현명하게 선택하세요
사용자에게 가장 가까운 지역을 선택하여 지연 시간을 최소화하세요. 현재 위치에서 지연 시간을 재측정하려면 재검색 버튼을 사용하세요.
사용 가능한 리전
| 구역 | 위치 |
|---|---|
| us-central1 | 아이오와, 미국 |
| us-east1 | 사우스캐롤라이나, 미국 |
| us-east4 | 미국 북부 버지니아 |
| us-east5 | 콜럼버스, 미국 |
| us-south1 | 댈러스, 미국 |
| us-west1 | 오리건, 미국 |
| us-west2 | 로스앤젤레스, 미국 |
| us-west3 | 솔트레이크시티, 미국 |
| us-west4 | 라스베이거스, 미국 |
| northamerica-northeast1 | 몬트리올, 캐나다 |
| northamerica-northeast2 | 토론토, 캐나다 |
| 북아메리카-남1 | 케레타로, 멕시코 |
| southamerica-east1 | 브라질 상파울루 |
| southamerica-west1 | 산티아고, 칠레 |
| 구역 | 위치 |
|---|---|
| 1 | 벨기에 생지슬랭 |
| 2 | 런던, 영국 |
| 3 | 프랑크푸르트, 독일 |
| 4 | 엠스하번, 네덜란드 |
| 6 | 취리히, 스위스 |
| 8 | 밀라노, 이탈리아 |
| 9 | 파리, 프랑스 |
| 10 | 베를린, 독일 |
| 12 | 토리노, 이탈리아 |
| europe-north1 | 하미나, 핀란드 |
| 유럽-북부2 | 스톡홀름, 스웨덴 |
| europe-central2 | 바르샤바, 폴란드 |
| europe-southwest1 | 마드리드, 스페인 |
| 구역 | 위치 |
|---|---|
| asia-east1 | 창화, 대만 |
| asia-east2 | 홍콩 구룡 |
| asia-northeast1 | 도쿄, 일본 |
| asia-northeast2 | 오사카, 일본 |
| asia-northeast3 | 대한민국 서울 |
| asia-south1 | 뭄바이, 인도 |
| asia-south2 | 델리, 인도 |
| asia-southeast1 | 싱가포르 주롱 웨스트 |
| asia-southeast2 | 자카르타, 인도네시아 |
| asia-southeast3 | 태국 방콕 |
| australia-southeast1 | 시드니, 호주 |
| australia-southeast2 | 멜버른, 호주 |
| 구역 | 위치 |
|---|---|
| africa-south1 | 요하네스버그, 남아프리카 공화국 |
| me-central1 | 도하, 카타르 |
| me-central2 | 담맘, 사우디아라비아 |
| me-west1 | 텔아비브, 이스라엘 |
엔드포인트 구성
새 배포 대화 상자
에 지정되어 있습니다. New Deployment 대화 상자가 제공하는 기능:
| 설정 | 설명 | 기본값 |
|---|---|---|
| 모델 | 완성된 모델 중에서 선택하세요 | - |
| 리전 | 배포 지역 | - |
| 배포 이름 | 자동 생성, 편집 가능 | - |
| CPU 코어 | CPU 할당 (1-8) | 1 |
| 메모리 (GB) | 메모리 할당 (1-32 GB) | 2 |

리소스 설정은 접을 수 있는 '리소스' 섹션에서 확인할 수 있습니다. 배포는 기본적으로 제로 스케일링(최소 인스턴스 = 0, 최대 인스턴스 = 1)을 사용합니다. 활성 추론 시간에 대해서만 비용이 청구됩니다.
자동 생성된 이름
배포 이름은 모델 이름과 지역 도시(예: yolo26n-iowa). 동일한 모델을 동일한 지역에 다시 배포하면 숫자 접미사가 추가됩니다 (예: yolo26n-iowa-2)입니다.
배포 탭 (빠른 배포)
모델의 Deploy 탭에서 엔드포인트는 기본 리소스( CPU 1개, 메모리 2GB)로 생성되며, 스케일 투 제로 기능이 활성화됩니다. 배포 이름은 자동 생성됩니다.
엔드포인트 관리
보기 모드
배포 목록은 세 가지 보기 모드를 지원합니다:
| 모드 | 설명 |
|---|---|
| 카드 | 로그, 코드 예제, 예측 패널이 포함된 상세 정보 카드 |
| 콤팩트 | 핵심 지표를 담은 소형 카드 그리드 |
| 테이블 | 정렬 가능한 열과 검색 기능을 갖춘 데이터 테이블 |

배포 카드 (카드 보기)
카드 보기의 각 배포 카드에는 다음이 표시됩니다.
- 헤더: 이름, 지역 플래그, 상태 배지, 시작/중지/삭제 버튼
- 엔드포인트 URL: API 문서 링크가 포함된 복사 가능한 URL
- 지표: 요청 수 (24시간), P95 지연 시간, 오류율
- 상태 확인: 지연 시간 및 수동 새로 고침 기능을 갖춘 실시간 상태 표시기
- 탭:
Logs,Code및Predict
에 지정되어 있습니다. Logs 탭은 심각도 필터링(전체 / 오류)을 적용한 최근 로그 항목을 표시합니다. Code 탭에는 실제 엔드포인트 URL과 API 키가 포함된 Python, JavaScript 및 cURL의 즉시 사용 가능한 코드 예제가 표시됩니다. Predict 탭은 배포 환경에서 직접 테스트할 수 있는 인라인 예측 패널을 제공합니다.
배포 상태
| 상태 | 설명 |
|---|---|
| 생성 | 배포 설정 중 |
| 배포 중 | 컨테이너 시작 중 |
| 준비 | 엔드포인트가 가동 중이며 요청을 수락하고 있습니다. |
| 멈춤 | 엔드포인트가 종료됩니다 |
| 멈췄다 | 엔드포인트가 일시 중지됨(요금 청구 없음) |
| 실패함 | 배포 실패 (오류 메시지 참조) |
엔드포인트 URL
각 엔드포인트에는 고유한 URL이 있습니다. 예를 들어:
https://predict-abc123.run.app

URL을 복사하려면 복사 버튼을 클릭합니다. 엔드포인트에 대한 자동 생성된 API 문서를 보려면 문서 아이콘을 클릭합니다.
수명 주기 관리
엔드포인트 상태를 제어하세요:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| 작업 | 설명 |
|---|---|
| 시작 | 중지된 엔드포인트 재개 |
| 중지 | 엔드포인트 일시 중지 (요금 청구 없음) |
| 삭제 | 엔드포인트 영구 제거 |
엔드포인트 중지
요금 청구를 일시 중지하려면 엔드포인트를 중지하세요:
- 배포 카드에서 일시 중지 아이콘을 클릭합니다.
- 엔드포인트 상태가 "중지 중"으로 변경된 후 "중지됨"으로 변경됩니다.
중지된 엔드포인트:
- 요청을 수락하지 않음
- 요금이 발생하지 않음
- 언제든지 다시 시작 가능
엔드포인트 삭제
엔드포인트 영구 제거:
- 배포 카드에서 삭제 (휴지통) 아이콘을 클릭합니다.
- 대화 상자에서 삭제 확인
영구적인 작업
삭제는 즉시 영구적으로 이루어집니다. 언제든지 새 엔드포인트를 생성할 수 있습니다.
엔드포인트 사용
인증
각 배포는 계정의 API 키로 생성됩니다. 요청에 포함하세요.
Authorization: Bearer YOUR_API_KEY
API 키 접두사는 식별을 위해 배포 카드 하단에 표시됩니다. API 키에서 키를 생성하십시오.
속도 제한 없음
전용 엔드포인트는 플랫폼 API 속도 제한을 받지 않습니다. 요청은 전용 서비스로 직접 전달되므로, 처리량은 엔드포인트의 CPU, 메모리 및 스케일링 구성에 의해서만 제한됩니다. 이는 API 키당 분당 20개 요청으로 속도 제한이 있는 공유 추론에 비해 주요 이점입니다.
요청 예시
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
요청 매개변수
| 파라미터 | 유형 | 기본값 | 설명 |
|---|---|---|---|
file | 파일 | - | 이미지 또는 동영상 파일 (필수) |
conf | 부동 소수점 | 0.25 | 최소 신뢰도 임계값 |
iou | 부동 소수점 | 0.7 | NMS IoU 임계값 |
imgsz | 정수 | 640 | 입력 이미지 크기 |
normalize | 문자열 | - | 정규화된 좌표 반환 |
동영상 추론
전용 엔드포인트는 이미지 외에 비디오 파일도 허용합니다. 지원되는 비디오 형식 (최대 100MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. 각 프레임은 개별적으로 처리되며, 결과는 프레임별로 반환됩니다. 지원되는 이미지 형식 (최대 50MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP.
응답 형식
작업별 필드를 포함하는 공유 추론과 동일합니다.
가격
기본 전용 엔드포인트는 모든 플랜에서 무료입니다. 더 높은 리소스 구성(더 많은 vCPU, 더 많은 메모리, 웜 스타트)은 향후 사용량 기반 요금제를 제공할 예정입니다.
비용 최적화
- 'scale-to-zero'(기본값)를 사용하여 엔드포인트가 요청을 수신할 때만 실행되도록 합니다
- 트래픽에 적합한 최대 인스턴스 수를 설정하세요
- 모니터링 대시보드에서 사용량 모니터링
FAQ
몇 개의 엔드포인트를 생성할 수 있나요?
엔드포인트 제한은 플랜에 따라 다릅니다:
- 무료: 최대 3회 배포
- Pro: 최대 10개 배포
- 엔터프라이즈: 무제한 배포
각 모델은 여전히 플랜 할당량 내에서 여러 지역에 배포될 수 있습니다.
배포 후 리전을 변경할 수 있나요?
아니요, 리전은 고정되어 있습니다. 리전을 변경하려면:
- 기존 엔드포인트 삭제
- 원하는 리전에 새 엔드포인트 생성
다중 리전 배포는 어떻게 처리하나요?
전역 커버리지를 위해:
- 여러 리전에 배포
- 로드 밸런서 또는 DNS 라우팅 사용
- 사용자를 가장 가까운 엔드포인트로 라우팅
콜드 스타트 시간은 얼마인가요?
콜드 스타트 시간은 모델 크기와 컨테이너가 해당 지역에 이미 캐시되어 있는지 여부에 따라 달라집니다. 일반적인 범위:
| 시나리오 | 콜드 스타트 |
|---|---|
| 캐시된 컨테이너 | ~5-15초 |
| 첫 배포/지역 | ~15-45초 |
건강 상태 확인은 최악의 경우 콜드 스타트 상황을 수용하기 위해 55초의 타임아웃을 사용합니다.
커스텀 도메인을 사용할 수 있나요?
사용자 지정 도메인은 곧 지원될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.