콘텐츠로 건너뛰기

전용 엔드포인트

Ultralytics 43개 글로벌 리전의 전용 엔드포인트에 YOLO 배포할 수 있도록 지원합니다. 각 엔드포인트는 자동 확장, 사용자 지정 URL, 독립적인 모니터링 기능을 갖춘 단일 테넌트 서비스입니다.

엔드포인트 생성

모델을 전용 엔드포인트에 배포하기:

  1. 모델로 이동하십시오
  2. 배포 탭을 클릭하세요
  3. 지도에서 지역을 선택하세요
  4. 배포 클릭

지역 선택

전 세계 43개 지역 중에서 선택하세요:

이 대화형 지도는 다음을 보여줍니다:

  • 지역 핀: 클릭하여 선택
  • 지연 지표: 거리별로 색상 구분
    • Green: <100ms
    • 노란색: 100-200ms
    • 빨강: >200ms

지역 테이블

모든 지역 상세 정보 보기:

칼럼설명
지역지역 식별자
위치도시/국가
지연 시간측정된 핑 시간
상태사용 가능/배치됨

현명하게 선택하세요

최저 지연 시간을 위해 사용자에게 가장 가까운 리전을 선택하십시오. 글로벌 커버리지를 위해 여러 리전에 배포하는 것을 고려하십시오.

이용 가능한 지역

아메리카 (15개 지역)

지역위치
us-central1아이오와, 미국
us-east1미국 사우스캐롤라이나주
us-east4미국 버지니아주
us-east5미국 콜럼버스
미국-남부1미국 텍사스주 댈러스
us-west1미국 오리건주
us-west2미국 로스앤젤레스
us-west3미국 솔트레이크시티
us-west4미국 라스베이거스
북아메리카-북동부1캐나다 몬트리올
북아메리카-북동부2토론토, 캐나다
남아메리카-동부1브라질 상파울루
남아메리카-서부1산티아고, 칠레

유럽 (12개 지역)

지역위치
유럽-중앙2폴란드 바르샤바
유럽-북부1핀란드
유럽-남서부1스페인 마드리드
유럽-서부1벨기에
유럽-서부2영국 런던
유럽-서부3독일 프랑크푸르트
유럽-서부4네덜란드
유럽-서부6스위스 취리히
유럽-서부8밀라노, 이탈리아
유럽-서부9프랑스 파리
유럽-서부10베를린, 독일
유럽-서부12이탈리아 토리노

아시아 태평양 (16개 지역)

지역위치
아시아-동부1대만
아시아-동부2홍콩
아시아-동북1일본 도쿄
아시아-동북2일본 오사카
아시아-동북3서울, 한국
아시아-남부1인도 뭄바이
아시아-남부2인도 델리
아시아-동남아시아1싱가포르
아시아-동남아시아2자카르타, 인도네시아
호주-남동부1시드니, 호주
호주-남동부2호주 멜버른
나 중심1카타르 도하
나 중심2담맘, 사우디아라비아
me-west1이스라엘 텔아비브

엔드포인트 구성

엔드포인트 생성 시:

설정설명기본값
지역배포 지역-
최소 인스턴스최소 실행 인스턴스0
최대 인스턴스 수최대 확장 한계10

확장 옵션

설정행동
최소값 = 0유휴 시 제로로 축소 (비용 효율적)
Min > 0항상 켜져 있어 콜드 스타트 없음
맥스트래픽 급증 상한선

콜드 스타트

최소 인스턴스 수 = 0일 경우, 유휴 상태 이후 첫 요청은 콜드 스타트(2~5초)를 유발합니다. 지연 시간에 민감한 애플리케이션의 경우 최소 값을 0보다 크게 설정하십시오.

엔드포인트 관리

엔드포인트 확인 및 관리:

엔드포인트 세부 정보

필드설명
URL요청용 HTTPS 엔드포인트
지역배포된 지역
상태실행 중, 중지됨, 배포 중
인스턴스현재/최대 인스턴스 수

종단점 URL

각 엔드포인트에는 고유한 URL이 있습니다:

https://model-abc123-us-central1.a.run.app

복사 버튼을 클릭하여 URL을 복사하세요.

라이프사이클 관리

엔드포인트 상태를 제어하세요:

액션설명
시작중지된 엔드포인트 재개
멈춰엔드포인트 일시 중지 (요금 부과 없음)
삭제엔드포인트를 영구적으로 제거합니다

종료 엔드포인트

엔드포인트를 중지하여 청구를 일시 중지합니다:

  1. 엔드포인트 작업 메뉴 열기
  2. 중지 클릭
  3. 확인을 누르세요

중지된 엔드포인트:

  • 요청을 수락하지 마십시오
  • 요금이 부과되지 않도록 하십시오
  • 언제든지 다시 시작할 수 있습니다

엔드포인트 삭제

엔드포인트를 영구적으로 제거하려면:

  1. 엔드포인트 작업 메뉴 열기
  2. 삭제하기
  3. 삭제 확인

영구적 조치

삭제는 즉시 영구적으로 이루어집니다. 새 엔드포인트를 언제든지 생성할 수 있습니다.

엔드포인트 사용

인증

요청에 API 키를 포함하세요:

Authorization: Bearer YOUR_API_KEY

요청 예시

curl -X POST \
  "https://model-abc123-us-central1.a.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg"
import requests

url = "https://model-abc123-us-central1.a.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}

response = requests.post(url, headers=headers, files=files)
print(response.json())

응답 형식

작업별 필드를 사용한 공유 추론과 동일합니다.

가격 책정

전용 엔드포인트 요금은 다음을 기준으로 청구됩니다:

구성 요소평가
CPUvCPU당 초당
메모리GB당 초
요청백만 건당 요청

비용 최적화

  • 개발용 엔드포인트에는 scale-to-zero를 사용하십시오
  • 적절한 최대 인스턴스 수 설정
  • 모니터링 대시보드에서 사용량 모니터링

FAQ

얼마나 많은 엔드포인트를 생성할 수 있나요?

엄격한 제한은 없습니다. 각 모델은 여러 리전에 엔드포인트를 가질 수 있습니다. 총 엔드포인트 수는 요금제에 따라 다릅니다.

배포 후 지역을 변경할 수 있나요?

아니요, 지역은 고정되어 있습니다. 지역을 변경하려면:

  1. 기존 엔드포인트 삭제
  2. 원하는 리전에 새 엔드포인트 생성

다중 지역 배포는 어떻게 처리하나요?

전 세계적 적용을 위해:

  1. 여러 지역에 배포
  2. 로드 밸런서 또는 DNS 라우팅을 사용하십시오.
  3. 사용자를 가장 가까운 종착점으로 안내하십시오

콜드 스타트 시간은 언제인가요?

콜드 스타트는 모델 크기에 따라 다릅니다:

모델콜드 스타트
YOLO11n~2초
YOLO11m~3초
YOLO11x~5초

콜드 스타트를 방지하려면 최소 인스턴스 수를 0보다 크게 설정하십시오.

사용자 지정 도메인을 사용할 수 있나요?

사용자 지정 도메인은 곧 제공될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.



📅 생성 0 일 전 ✏️ 업데이트 0일 전
glenn-jocher

댓글