전용 엔드포인트
Ultralytics 43개 글로벌 리전의 전용 엔드포인트에 YOLO 배포할 수 있도록 지원합니다. 각 엔드포인트는 자동 확장, 사용자 지정 URL, 독립적인 모니터링 기능을 갖춘 단일 테넌트 서비스입니다.
엔드포인트 생성
모델을 전용 엔드포인트에 배포하기:
- 모델로 이동하십시오
- 배포 탭을 클릭하세요
- 지도에서 지역을 선택하세요
- 배포 클릭
지역 선택
전 세계 43개 지역 중에서 선택하세요:
이 대화형 지도는 다음을 보여줍니다:
- 지역 핀: 클릭하여 선택
- 지연 지표: 거리별로 색상 구분
- Green: <100ms
- 노란색: 100-200ms
- 빨강: >200ms
지역 테이블
모든 지역 상세 정보 보기:
| 칼럼 | 설명 |
|---|---|
| 지역 | 지역 식별자 |
| 위치 | 도시/국가 |
| 지연 시간 | 측정된 핑 시간 |
| 상태 | 사용 가능/배치됨 |
현명하게 선택하세요
최저 지연 시간을 위해 사용자에게 가장 가까운 리전을 선택하십시오. 글로벌 커버리지를 위해 여러 리전에 배포하는 것을 고려하십시오.
이용 가능한 지역
아메리카 (15개 지역)
| 지역 | 위치 |
|---|---|
| us-central1 | 아이오와, 미국 |
| us-east1 | 미국 사우스캐롤라이나주 |
| us-east4 | 미국 버지니아주 |
| us-east5 | 미국 콜럼버스 |
| 미국-남부1 | 미국 텍사스주 댈러스 |
| us-west1 | 미국 오리건주 |
| us-west2 | 미국 로스앤젤레스 |
| us-west3 | 미국 솔트레이크시티 |
| us-west4 | 미국 라스베이거스 |
| 북아메리카-북동부1 | 캐나다 몬트리올 |
| 북아메리카-북동부2 | 토론토, 캐나다 |
| 남아메리카-동부1 | 브라질 상파울루 |
| 남아메리카-서부1 | 산티아고, 칠레 |
유럽 (12개 지역)
| 지역 | 위치 |
|---|---|
| 유럽-중앙2 | 폴란드 바르샤바 |
| 유럽-북부1 | 핀란드 |
| 유럽-남서부1 | 스페인 마드리드 |
| 유럽-서부1 | 벨기에 |
| 유럽-서부2 | 영국 런던 |
| 유럽-서부3 | 독일 프랑크푸르트 |
| 유럽-서부4 | 네덜란드 |
| 유럽-서부6 | 스위스 취리히 |
| 유럽-서부8 | 밀라노, 이탈리아 |
| 유럽-서부9 | 프랑스 파리 |
| 유럽-서부10 | 베를린, 독일 |
| 유럽-서부12 | 이탈리아 토리노 |
아시아 태평양 (16개 지역)
| 지역 | 위치 |
|---|---|
| 아시아-동부1 | 대만 |
| 아시아-동부2 | 홍콩 |
| 아시아-동북1 | 일본 도쿄 |
| 아시아-동북2 | 일본 오사카 |
| 아시아-동북3 | 서울, 한국 |
| 아시아-남부1 | 인도 뭄바이 |
| 아시아-남부2 | 인도 델리 |
| 아시아-동남아시아1 | 싱가포르 |
| 아시아-동남아시아2 | 자카르타, 인도네시아 |
| 호주-남동부1 | 시드니, 호주 |
| 호주-남동부2 | 호주 멜버른 |
| 나 중심1 | 카타르 도하 |
| 나 중심2 | 담맘, 사우디아라비아 |
| me-west1 | 이스라엘 텔아비브 |
엔드포인트 구성
엔드포인트 생성 시:
| 설정 | 설명 | 기본값 |
|---|---|---|
| 지역 | 배포 지역 | - |
| 최소 인스턴스 | 최소 실행 인스턴스 | 0 |
| 최대 인스턴스 수 | 최대 확장 한계 | 10 |
확장 옵션
| 설정 | 행동 |
|---|---|
| 최소값 = 0 | 유휴 시 제로로 축소 (비용 효율적) |
| Min > 0 | 항상 켜져 있어 콜드 스타트 없음 |
| 맥스 | 트래픽 급증 상한선 |
콜드 스타트
최소 인스턴스 수 = 0일 경우, 유휴 상태 이후 첫 요청은 콜드 스타트(2~5초)를 유발합니다. 지연 시간에 민감한 애플리케이션의 경우 최소 값을 0보다 크게 설정하십시오.
엔드포인트 관리
엔드포인트 확인 및 관리:
엔드포인트 세부 정보
| 필드 | 설명 |
|---|---|
| URL | 요청용 HTTPS 엔드포인트 |
| 지역 | 배포된 지역 |
| 상태 | 실행 중, 중지됨, 배포 중 |
| 인스턴스 | 현재/최대 인스턴스 수 |
종단점 URL
각 엔드포인트에는 고유한 URL이 있습니다:
https://model-abc123-us-central1.a.run.app
복사 버튼을 클릭하여 URL을 복사하세요.
라이프사이클 관리
엔드포인트 상태를 제어하세요:
| 액션 | 설명 |
|---|---|
| 시작 | 중지된 엔드포인트 재개 |
| 멈춰 | 엔드포인트 일시 중지 (요금 부과 없음) |
| 삭제 | 엔드포인트를 영구적으로 제거합니다 |
종료 엔드포인트
엔드포인트를 중지하여 청구를 일시 중지합니다:
- 엔드포인트 작업 메뉴 열기
- 중지 클릭
- 확인을 누르세요
중지된 엔드포인트:
- 요청을 수락하지 마십시오
- 요금이 부과되지 않도록 하십시오
- 언제든지 다시 시작할 수 있습니다
엔드포인트 삭제
엔드포인트를 영구적으로 제거하려면:
- 엔드포인트 작업 메뉴 열기
- 삭제하기
- 삭제 확인
영구적 조치
삭제는 즉시 영구적으로 이루어집니다. 새 엔드포인트를 언제든지 생성할 수 있습니다.
엔드포인트 사용
인증
요청에 API 키를 포함하세요:
Authorization: Bearer YOUR_API_KEY
요청 예시
curl -X POST \
"https://model-abc123-us-central1.a.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg"
import requests
url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
response = requests.post(url, headers=headers, files=files)
print(response.json())
응답 형식
작업별 필드를 사용한 공유 추론과 동일합니다.
가격 책정
전용 엔드포인트 요금은 다음을 기준으로 청구됩니다:
| 구성 요소 | 평가 |
|---|---|
| CPU | vCPU당 초당 |
| 메모리 | GB당 초 |
| 요청 | 백만 건당 요청 |
비용 최적화
- 개발용 엔드포인트에는 scale-to-zero를 사용하십시오
- 적절한 최대 인스턴스 수 설정
- 모니터링 대시보드에서 사용량 모니터링
FAQ
얼마나 많은 엔드포인트를 생성할 수 있나요?
엄격한 제한은 없습니다. 각 모델은 여러 리전에 엔드포인트를 가질 수 있습니다. 총 엔드포인트 수는 요금제에 따라 다릅니다.
배포 후 지역을 변경할 수 있나요?
아니요, 지역은 고정되어 있습니다. 지역을 변경하려면:
- 기존 엔드포인트 삭제
- 원하는 리전에 새 엔드포인트 생성
다중 지역 배포는 어떻게 처리하나요?
전 세계적 적용을 위해:
- 여러 지역에 배포
- 로드 밸런서 또는 DNS 라우팅을 사용하십시오.
- 사용자를 가장 가까운 종착점으로 안내하십시오
콜드 스타트 시간은 언제인가요?
콜드 스타트는 모델 크기에 따라 다릅니다:
| 모델 | 콜드 스타트 |
|---|---|
| YOLO11n | ~2초 |
| YOLO11m | ~3초 |
| YOLO11x | ~5초 |
콜드 스타트를 방지하려면 최소 인스턴스 수를 0보다 크게 설정하십시오.
사용자 지정 도메인을 사용할 수 있나요?
사용자 지정 도메인은 곧 제공될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.