Meet YOLO26: next-gen vision AI.

Link to this section전용 엔드포인트#

Ultralytics Platform은 전 세계 43개 지역의 전용 엔드포인트에 YOLO 모델을 배포할 수 있도록 지원합니다. 각 엔드포인트는 규모에 따라 0으로 자동 조정(scale-to-zero)되는 싱글 테넌트 서비스이며, 고유한 엔드포인트 URL과 독립적인 모니터링 기능을 제공합니다.

지역 지도 및 표가 포함된 Ultralytics Platform 모델 배포 탭

Link to this section엔드포인트 생성#

Link to this section배포(Deploy) 탭에서 생성#

모델의 Deploy 탭에서 모델을 배포합니다:

  1. 모델로 이동합니다
  2. Deploy 탭을 클릭합니다.
  3. 대화형 세계 지도에서 지역을 선택합니다. 지역은 현재 위치로부터의 지연 시간(latency)에 따라 녹색에서 빨간색으로 그라데이션 표시됩니다(더 빠른 지역은 녹색에 가깝고, 더 느린 지역은 빨간색에 가깝습니다).
  4. 지역 행에서 Deploy를 클릭합니다.

배포 이름은 모델 이름과 지역 도시를 기반으로 자동 생성됩니다(예: yolo26n-iowa).

Link to this section배포(Deployments) 페이지에서 생성#

사이드바의 전역 Deploy 페이지에서 배포를 생성합니다:

  1. New Deployment를 클릭합니다.
  2. 모델 선택기에서 모델을 선택합니다.
  3. 지도 또는 표에서 지역을 선택합니다.
  4. 자동 생성된 배포 이름(수정 가능)과 기본 리소스를 검토합니다.
  5. Deploy Model을 클릭합니다.

모델 선택기 및 지역 지도가 포함된 Ultralytics Platform 새 배포 대화 상자

Link to this section배포 수명 주기#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this section리전 선택#

전 세계 43개 지역 중에서 선택하십시오. 대화형 지역 지도와 표는 다음 정보를 보여줍니다:

  • 지역 핀(Region pins): 지연 시간에 따라 녹색에서 빨간색으로 그라데이션 색상이 지정됩니다(빠를수록 녹색, 느릴수록 빨간색).
  • 배포된 지역(Deployed regions): "Deployed" 배지로 강조 표시됩니다.
  • 배포 중인 지역(Deploying regions): 애니메이션 펄스 표시기가 나타납니다.
  • 양방향 강조(Bidirectional highlighting): 지도에 마우스를 올리면 표의 행이 강조 표시되며, 그 반대의 경우도 동일합니다.

지연 시간순으로 정렬된 Ultralytics Platform 배포 탭 지역 지연 시간 표

모델 Deploy 탭의 지역 표에는 다음 항목이 포함됩니다:

설명
위치(Location)국기 아이콘이 포함된 도시 및 국가
영역(Zone)지역 식별자
지연 시간측정된 핑(ping) 시간(3회 핑의 중간값)
거리(Distance)사용자 위치로부터의 거리(km 단위)
작업(Actions)배포 버튼 또는 "Deployed" 상태 배지
새 배포 대화 상자

The New Deployment dialog (from the global Deploy page) shows a simpler region table with only Location, Latency, and Select columns.

현명하게 선택하십시오

지연 시간을 최소화하려면 사용자에게 가장 가까운 지역을 선택하십시오. Rescan 버튼을 사용하여 현재 위치에서의 지연 시간을 다시 측정할 수 있습니다.

Link to this section사용 가능한 지역#

영역위치
us-central1미국 아이오와주
us-east1미국 사우스캐롤라이나
us-east4미국 북부 버지니아
us-east5미국 콜럼버스
us-south1미국 댈러스
us-west1미국 오리건
us-west2미국 로스앤젤레스
us-west3미국 솔트레이크시티
us-west4미국 라스베이거스
northamerica-northeast1캐나다 몬트리올
northamerica-northeast2캐나다 토론토
northamerica-south1멕시코 케레타로
southamerica-east1브라질 상파울루
southamerica-west1칠레 산티아고

Link to this section엔드포인트 구성#

Link to this section새 배포 대화 상자#

New Deployment 대화 상자에서 제공하는 항목은 다음과 같습니다.

설정설명기본값
모델완료된 모델 중에서 선택-
리전배포 리전-
배포 이름자동 생성, 수정 가능-
CPU 코어고정 기본값1
메모리 (GB)고정 기본값2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

배포는 1 CPU, 2 GiB 메모리, minInstances = 0, maxInstances = 1의 고정 기본값을 사용합니다. 유휴 상태일 때는 0으로 스케일링되므로 활성 추론 시간에 대해서만 요금이 부과됩니다.

자동 생성된 이름

배포 이름은 모델 이름과 리전 도시에서 자동으로 생성됩니다(예: yolo26n-iowa). 동일한 모델을 동일한 리전에 다시 배포하면 숫자 접미사가 추가됩니다(예: yolo26n-iowa-2).

Link to this section배포 탭 (빠른 배포)#

모델의 Deploy 탭에서 배포할 때, 엔드포인트는 기본 리소스(1 CPU, 2 GB 메모리)와 스케일-투-제로(scale-to-zero) 기능이 활성화된 상태로 생성됩니다. 배포 이름은 자동으로 생성됩니다.

Link to this section엔드포인트 관리#

Link to this section보기 모드#

배포 목록은 다음 세 가지 보기 모드를 지원합니다:

모드설명
카드로그, 코드 예제, 예측 패널이 포함된 상세 카드 보기
컴팩트주요 지표가 포함된 작은 카드 그리드 보기
테이블정렬 가능한 열과 검색 기능을 갖춘 데이터 테이블 보기

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this section배포 카드 (카드 보기)#

카드 보기에 있는 각 배포 카드는 다음 정보를 표시합니다:

  • 헤더: 이름, 리전 플래그, 상태 배지, 시작/중지/삭제 버튼
  • 엔드포인트 URL: API 문서 링크가 포함된 복사 가능한 URL
  • 지표: 요청 수(24시간), P95 지연 시간, 오류율
  • 상태 점검: 지연 시간과 수동 새로 고침 기능을 갖춘 실시간 상태 표시기
  • : Logs, Code, Predict

Logs 탭은 심각도 필터링(전체/오류)이 포함된 최근 로그 항목을 보여줍니다. Code 탭은 실제 엔드포인트 URL 및 API 키가 포함된 Python, JavaScript, cURL 형식의 즉시 사용 가능한 코드 예제를 제공합니다. Predict 탭은 배포 환경에서 직접 테스트할 수 있는 인라인 예측 패널을 제공합니다.

Link to this section배포 상태#

상태설명
생성 중(Creating)배포가 설정되는 중입니다
배포 중(Deploying)컨테이너가 시작되는 중입니다
준비 완료(Ready)엔드포인트가 활성화되어 요청을 수락하고 있습니다
중지 중(Stopping)엔드포인트가 종료되는 중입니다
중지됨(Stopped)엔드포인트가 일시 중지되었습니다(요금 미부과)
실패함(Failed)배포 실패(오류 메시지 참조)

Link to this section엔드포인트 URL#

각 엔드포인트는 다음과 같은 고유한 URL을 가집니다:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

복사 버튼을 클릭하여 URL을 복사하십시오. 문서 아이콘을 클릭하여 해당 엔드포인트에 대해 자동 생성된 API 문서를 확인하십시오.

Link to this section수명 주기 관리#

엔드포인트 상태 제어:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
작업설명
시작중지된 엔드포인트 다시 시작
중지엔드포인트 일시 중지(요금 미부과)
Delete엔드포인트 영구 삭제

Link to this section엔드포인트 중지#

요금 부과를 일시 중지하려면 엔드포인트를 중지하십시오:

  1. 배포 카드에서 일시 중지 아이콘을 클릭하십시오
  2. 엔드포인트 상태가 "중지 중"에서 "중지됨"으로 변경됩니다

중지된 엔드포인트:

  • 요청을 수락하지 않음
  • 비용이 발생하지 않음
  • 언제든지 다시 시작 가능

Link to this section엔드포인트 삭제#

엔드포인트를 영구적으로 제거하려면:

  1. 배포 카드에서 삭제(휴지통) 아이콘을 클릭하십시오
  2. 대화 상자에서 삭제를 확인하십시오
영구적인 작업

삭제는 즉시 영구적으로 수행됩니다. 언제든지 새로운 엔드포인트를 생성할 수 있습니다.

Link to this section엔드포인트 사용#

Link to this section인증#

각 배포는 귀하 계정의 API 키와 함께 생성됩니다. 요청 시 이를 포함하십시오:

Authorization: Bearer YOUR_API_KEY

API 키 접두사는 식별을 위해 배포 카드 하단에 표시됩니다. API Keys에서 키를 생성하십시오.

Link to this section속도 제한 없음#

전용 엔드포인트 URL로 직접 전송되는 요청은 Platform API 속도 제한의 적용을 받지 않습니다. 처리량은 엔드포인트의 CPU, 메모리 및 스케일링 구성에 의해서만 제한됩니다. (브라우저 내 테스터와 같이 Platform API를 통해 프록시되는 요청은 여전히 표준 20회/분 예측 제한을 사용합니다.) 이것은 API 키당 20회/분으로 속도가 제한되는 공유 추론에 비해 가진 핵심적인 장점입니다.

Link to this section요청 예시#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this section요청 파라미터#

파라미터유형기본값범위설명
file파일--이미지 또는 비디오 파일 (필수)
conf부동 소수점(float)0.250.01 – 1.0최소 신뢰도 임계값
iou부동 소수점(float)0.70.0 – 0.95NMS IoU 임계값
imgsz정수(int)64032 – 1280입력 이미지 크기 (픽셀 단위)
normalizeboolfalse-바운딩 박스 좌표를 0 – 1 범위로 반환
decimals정수(int)50 – 10좌표 값에 대한 소수점 정밀도
source문자열(string)--이미지 URL 또는 base64 문자열 (file의 대안)
비디오 추론

전용 엔드포인트는 file 매개변수를 통해 이미지와 비디오를 모두 수락합니다.

  • 이미지 형식 (최대 100 MB): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • 비디오 형식 (최대 100 MB): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Each video frame is processed individually and results are returned per frame. You can also pass a public image URL or a base64-encoded image via the source parameter instead of file.

Link to this section응답 형식#

작업별 필드가 포함된 shared inference와 동일합니다.

Link to this section가격#

기본 전용 엔드포인트는 모든 플랜에서 무료입니다. 향후 더 높은 리소스 구성(더 많은 vCPU, 더 많은 메모리, 웜 스타트)에 대해 사용량 기반 요금이 제공될 예정입니다.

비용 최적화
  • 요청을 받을 때만 엔드포인트가 실행되도록 스케일 투 제로(기본값) 기능을 사용하십시오.
  • 트래픽에 적절한 최대 인스턴스 수를 설정하십시오.
  • Monitoring 대시보드에서 사용량을 모니터링하십시오.

Link to this sectionFAQ#

Link to this section몇 개의 엔드포인트를 생성할 수 있습니까?#

엔드포인트 제한은 플랜에 따라 다릅니다:

  • Free: 최대 3개 배포
  • Pro: 최대 10개 배포
  • Enterprise: 무제한 배포

각 모델은 플랜 할당량 내에서 여러 지역에 배포할 수 있습니다.

Link to this section배포 후 지역을 변경할 수 있습니까?#

아니요, 지역은 고정되어 있습니다. 지역을 변경하려면 다음을 수행하십시오:

  1. 기존 엔드포인트 삭제
  2. 원하는 지역에 새 엔드포인트 생성

Link to this section다중 지역 배포는 어떻게 처리합니까?#

글로벌 커버리지를 위해 다음을 수행하십시오:

  1. 여러 지역에 배포
  2. 로드 밸런서 또는 DNS 라우팅 사용
  3. 사용자를 가장 가까운 엔드포인트로 라우팅

Link to this section콜드 스타트 시간은 어떻게 됩니까?#

콜드 스타트 시간은 모델 크기와 해당 지역에 컨테이너가 이미 캐시되어 있는지 여부에 따라 다릅니다. 일반적인 범위는 다음과 같습니다:

시나리오콜드 스타트
캐시된 컨테이너~5-15초
첫 배포/지역~15-45초

상태 확인은 최악의 콜드 스타트 상황을 수용하기 위해 55초의 타임아웃을 사용합니다.

Link to this section사용자 지정 도메인을 사용할 수 있습니까?#

사용자 지정 도메인 기능은 곧 제공될 예정입니다. 현재 엔드포인트는 플랫폼에서 생성된 URL을 사용합니다.

댓글