콘텐츠로 건너뛰기

전용 엔드포인트

Ultralytics Platform은 43개 글로벌 리전에 전용 엔드포인트로 YOLO 모델을 배포할 수 있도록 지원합니다. 각 엔드포인트는 자동 스케일링, 사용자 지정 URL 및 독립적인 모니터링 기능을 갖춘 단일 테넌트 서비스입니다.

엔드포인트 생성

모델을 전용 엔드포인트에 배포하기:

  1. 모델로 이동
  2. 배포 탭을 클릭합니다.
  3. 지도에서 리전을 선택합니다.
  4. 배포를 클릭합니다.

지역 선택

전 세계 43개 리전 중에서 선택하세요:

대화형 지도에는 다음이 표시됩니다:

  • 리전 핀: 클릭하여 선택
  • 지연 시간 표시기: 거리에 따라 색상으로 구분됨
    • Green: <100ms
    • 노란색: 100-200ms
    • 빨간색: >200ms

리전 표

모든 리전을 세부 정보와 함께 보기:

설명
리전리전 식별자
위치도시/국가
지연 시간측정된 핑 시간
상태사용 가능/배포됨

현명하게 선택하세요

가장 낮은 지연 시간을 위해 사용자에게 가장 가까운 리전을 선택하십시오. 전역 커버리지를 위해 여러 리전에 배포하는 것을 고려하십시오.

사용 가능한 리전

아메리카 지역 (14개 지역)

구역위치
us-central1아이오와, 미국
us-east1사우스캐롤라이나, 미국
us-east4버지니아, 미국
us-east5미국 오하이오주
us-west1오리건, 미국
us-west2로스앤젤레스, 미국
us-west3솔트레이크시티, 미국
us-west4라스베이거스, 미국
us-south1댈러스, 미국
northamerica-northeast1몬트리올, 캐나다
northamerica-northeast2토론토, 캐나다
southamerica-east1상파울루, 브라질
southamerica-west1산티아고, 칠레

유럽 (12개 리전)

구역위치
1벨기에
2런던, 영국
3프랑크푸르트, 독일
4네덜란드
6취리히, 스위스
8밀라노, 이탈리아
9파리, 프랑스
10베를린, 독일
12토리노, 이탈리아
europe-north1핀란드
europe-central2바르샤바, 폴란드
europe-southwest1마드리드, 스페인

아시아 태평양 (14개 지역)

구역위치
asia-east1대만
asia-east2홍콩
asia-northeast1도쿄, 일본
asia-northeast2오사카, 일본
asia-northeast3대한민국 서울
asia-south1뭄바이, 인도
asia-south2델리, 인도
asia-southeast1싱가포르
asia-southeast2자카르타, 인도네시아
australia-southeast1시드니, 호주
australia-southeast2멜버른, 호주

중동 및 아프리카 (3개 지역)

구역위치
me-central1도하, 카타르
me-central2담맘, 사우디아라비아
me-west1텔아비브, 이스라엘

엔드포인트 구성

엔드포인트 생성 시:

설정설명기본값
리전배포 지역-
최소 인스턴스최소 실행 인스턴스 수0
최대 인스턴스최대 스케일링 제한10

스케일링 옵션

설정동작
최소 = 0유휴 상태 시 0으로 스케일링 (비용 효율적)
최소 > 0콜드 스타트 방지를 위한 항상 켜짐
최대트래픽 급증에 대한 상한선

콜드 스타트

최소 인스턴스 = 0으로 설정하면 유휴 상태 후 첫 요청 시 콜드 스타트(2-5초)가 발생합니다. 지연 시간에 민감한 애플리케이션의 경우 최소 인스턴스를 0보다 크게 설정하십시오.

엔드포인트 관리

엔드포인트 보기 및 관리:

엔드포인트 세부 정보

필드설명
URL요청을 위한 HTTPS 엔드포인트
리전배포된 지역
상태실행 중, 중지됨, 배포 중
인스턴스현재/최대 인스턴스 수

엔드포인트 URL

각 엔드포인트는 고유한 URL을 가집니다:

https://model-abc123-us-central1.a.run.app

URL을 복사하려면 복사 버튼을 클릭하세요.

수명 주기 관리

엔드포인트 상태를 제어하세요:

작업설명
시작중지된 엔드포인트 재개
중지엔드포인트 일시 중지 (요금 청구 없음)
삭제엔드포인트 영구 제거

엔드포인트 중지

요금 청구를 일시 중지하려면 엔드포인트를 중지하세요:

  1. 엔드포인트 작업 메뉴 열기
  2. 중지를 클릭하세요.
  3. 작업 확인

중지된 엔드포인트:

  • 요청을 수락하지 않음
  • 요금이 발생하지 않음
  • 언제든지 다시 시작 가능

엔드포인트 삭제

엔드포인트 영구 제거:

  1. 엔드포인트 작업 메뉴 열기
  2. 삭제를 클릭하세요.
  3. 삭제 확인

영구적인 작업

삭제는 즉시 영구적으로 이루어집니다. 언제든지 새 엔드포인트를 생성할 수 있습니다.

엔드포인트 사용

인증

요청에 API 키 포함:

Authorization: Bearer YOUR_API_KEY

요청 예시

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

응답 형식

작업별 필드를 포함하는 공유 추론과 동일합니다.

가격

전용 엔드포인트는 다음을 기준으로 요금이 청구됩니다:

구성 요소요율
CPUvCPU-초당
메모리GB-초당
요청백만 요청당

비용 최적화

  • 개발 엔드포인트에 스케일-투-제로 사용
  • 적절한 최대 인스턴스 설정
  • 모니터링 대시보드에서 사용량 모니터링

FAQ

몇 개의 엔드포인트를 생성할 수 있나요?

엄격한 제한은 없습니다. 각 모델은 여러 리전에 엔드포인트를 가질 수 있으며, 총 엔드포인트 수는 사용자의 플랜에 따라 달라집니다.

배포 후 리전을 변경할 수 있나요?

아니요, 리전은 고정되어 있습니다. 리전을 변경하려면:

  1. 기존 엔드포인트 삭제
  2. 원하는 리전에 새 엔드포인트 생성

다중 리전 배포는 어떻게 처리하나요?

전역 커버리지를 위해:

  1. 여러 리전에 배포
  2. 로드 밸런서 또는 DNS 라우팅 사용
  3. 사용자를 가장 가까운 엔드포인트로 라우팅

콜드 스타트 시간은 얼마인가요?

콜드 스타트는 모델 크기에 따라 다릅니다:

모델콜드 스타트
YOLO26n~2초
YOLO26m~3초
YOLO26x~5초

콜드 스타트를 제거하려면 최소 인스턴스를 0보다 크게 설정하십시오.

커스텀 도메인을 사용할 수 있나요?

사용자 지정 도메인은 곧 지원될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.



5; 20 전에 생성됨 ✏️ 14 전에 업데이트됨
glenn-jocher

댓글