전용 엔드포인트
Ultralytics Platform은 43개 글로벌 리전에 전용 엔드포인트로 YOLO 모델을 배포할 수 있도록 지원합니다. 각 엔드포인트는 자동 스케일링, 사용자 지정 URL 및 독립적인 모니터링 기능을 갖춘 단일 테넌트 서비스입니다.
엔드포인트 생성
모델을 전용 엔드포인트에 배포하기:
- 모델로 이동
- 배포 탭을 클릭합니다.
- 지도에서 리전을 선택합니다.
- 배포를 클릭합니다.
지역 선택
전 세계 43개 리전 중에서 선택하세요:
대화형 지도에는 다음이 표시됩니다:
- 리전 핀: 클릭하여 선택
- 지연 시간 표시기: 거리에 따라 색상으로 구분됨
- Green: <100ms
- 노란색: 100-200ms
- 빨간색: >200ms
리전 표
모든 리전을 세부 정보와 함께 보기:
| 열 | 설명 |
|---|---|
| 리전 | 리전 식별자 |
| 위치 | 도시/국가 |
| 지연 시간 | 측정된 핑 시간 |
| 상태 | 사용 가능/배포됨 |
현명하게 선택하세요
가장 낮은 지연 시간을 위해 사용자에게 가장 가까운 리전을 선택하십시오. 전역 커버리지를 위해 여러 리전에 배포하는 것을 고려하십시오.
사용 가능한 리전
아메리카 지역 (14개 지역)
| 구역 | 위치 |
|---|---|
| us-central1 | 아이오와, 미국 |
| us-east1 | 사우스캐롤라이나, 미국 |
| us-east4 | 버지니아, 미국 |
| us-east5 | 미국 오하이오주 |
| us-west1 | 오리건, 미국 |
| us-west2 | 로스앤젤레스, 미국 |
| us-west3 | 솔트레이크시티, 미국 |
| us-west4 | 라스베이거스, 미국 |
| us-south1 | 댈러스, 미국 |
| northamerica-northeast1 | 몬트리올, 캐나다 |
| northamerica-northeast2 | 토론토, 캐나다 |
| southamerica-east1 | 상파울루, 브라질 |
| southamerica-west1 | 산티아고, 칠레 |
유럽 (12개 리전)
| 구역 | 위치 |
|---|---|
| 1 | 벨기에 |
| 2 | 런던, 영국 |
| 3 | 프랑크푸르트, 독일 |
| 4 | 네덜란드 |
| 6 | 취리히, 스위스 |
| 8 | 밀라노, 이탈리아 |
| 9 | 파리, 프랑스 |
| 10 | 베를린, 독일 |
| 12 | 토리노, 이탈리아 |
| europe-north1 | 핀란드 |
| europe-central2 | 바르샤바, 폴란드 |
| europe-southwest1 | 마드리드, 스페인 |
아시아 태평양 (14개 지역)
| 구역 | 위치 |
|---|---|
| asia-east1 | 대만 |
| asia-east2 | 홍콩 |
| asia-northeast1 | 도쿄, 일본 |
| asia-northeast2 | 오사카, 일본 |
| asia-northeast3 | 대한민국 서울 |
| asia-south1 | 뭄바이, 인도 |
| asia-south2 | 델리, 인도 |
| asia-southeast1 | 싱가포르 |
| asia-southeast2 | 자카르타, 인도네시아 |
| australia-southeast1 | 시드니, 호주 |
| australia-southeast2 | 멜버른, 호주 |
중동 및 아프리카 (3개 지역)
| 구역 | 위치 |
|---|---|
| me-central1 | 도하, 카타르 |
| me-central2 | 담맘, 사우디아라비아 |
| me-west1 | 텔아비브, 이스라엘 |
엔드포인트 구성
엔드포인트 생성 시:
| 설정 | 설명 | 기본값 |
|---|---|---|
| 리전 | 배포 지역 | - |
| 최소 인스턴스 | 최소 실행 인스턴스 수 | 0 |
| 최대 인스턴스 | 최대 스케일링 제한 | 10 |
스케일링 옵션
| 설정 | 동작 |
|---|---|
| 최소 = 0 | 유휴 상태 시 0으로 스케일링 (비용 효율적) |
| 최소 > 0 | 콜드 스타트 방지를 위한 항상 켜짐 |
| 최대 | 트래픽 급증에 대한 상한선 |
콜드 스타트
최소 인스턴스 = 0으로 설정하면 유휴 상태 후 첫 요청 시 콜드 스타트(2-5초)가 발생합니다. 지연 시간에 민감한 애플리케이션의 경우 최소 인스턴스를 0보다 크게 설정하십시오.
엔드포인트 관리
엔드포인트 보기 및 관리:
엔드포인트 세부 정보
| 필드 | 설명 |
|---|---|
| URL | 요청을 위한 HTTPS 엔드포인트 |
| 리전 | 배포된 지역 |
| 상태 | 실행 중, 중지됨, 배포 중 |
| 인스턴스 | 현재/최대 인스턴스 수 |
엔드포인트 URL
각 엔드포인트는 고유한 URL을 가집니다:
https://model-abc123-us-central1.a.run.app
URL을 복사하려면 복사 버튼을 클릭하세요.
수명 주기 관리
엔드포인트 상태를 제어하세요:
| 작업 | 설명 |
|---|---|
| 시작 | 중지된 엔드포인트 재개 |
| 중지 | 엔드포인트 일시 중지 (요금 청구 없음) |
| 삭제 | 엔드포인트 영구 제거 |
엔드포인트 중지
요금 청구를 일시 중지하려면 엔드포인트를 중지하세요:
- 엔드포인트 작업 메뉴 열기
- 중지를 클릭하세요.
- 작업 확인
중지된 엔드포인트:
- 요청을 수락하지 않음
- 요금이 발생하지 않음
- 언제든지 다시 시작 가능
엔드포인트 삭제
엔드포인트 영구 제거:
- 엔드포인트 작업 메뉴 열기
- 삭제를 클릭하세요.
- 삭제 확인
영구적인 작업
삭제는 즉시 영구적으로 이루어집니다. 언제든지 새 엔드포인트를 생성할 수 있습니다.
엔드포인트 사용
인증
요청에 API 키 포함:
Authorization: Bearer YOUR_API_KEY
요청 예시
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
응답 형식
작업별 필드를 포함하는 공유 추론과 동일합니다.
가격
전용 엔드포인트는 다음을 기준으로 요금이 청구됩니다:
| 구성 요소 | 요율 |
|---|---|
| CPU | vCPU-초당 |
| 메모리 | GB-초당 |
| 요청 | 백만 요청당 |
비용 최적화
- 개발 엔드포인트에 스케일-투-제로 사용
- 적절한 최대 인스턴스 설정
- 모니터링 대시보드에서 사용량 모니터링
FAQ
몇 개의 엔드포인트를 생성할 수 있나요?
엄격한 제한은 없습니다. 각 모델은 여러 리전에 엔드포인트를 가질 수 있으며, 총 엔드포인트 수는 사용자의 플랜에 따라 달라집니다.
배포 후 리전을 변경할 수 있나요?
아니요, 리전은 고정되어 있습니다. 리전을 변경하려면:
- 기존 엔드포인트 삭제
- 원하는 리전에 새 엔드포인트 생성
다중 리전 배포는 어떻게 처리하나요?
전역 커버리지를 위해:
- 여러 리전에 배포
- 로드 밸런서 또는 DNS 라우팅 사용
- 사용자를 가장 가까운 엔드포인트로 라우팅
콜드 스타트 시간은 얼마인가요?
콜드 스타트는 모델 크기에 따라 다릅니다:
| 모델 | 콜드 스타트 |
|---|---|
| YOLO26n | ~2초 |
| YOLO26m | ~3초 |
| YOLO26x | ~5초 |
콜드 스타트를 제거하려면 최소 인스턴스를 0보다 크게 설정하십시오.
커스텀 도메인을 사용할 수 있나요?
사용자 지정 도메인은 곧 지원될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.